只需5分钟训练一个微型 LLM?这个项目带你打破 AI 黑盒
GuppyLM 是一个仅拥有约 900 万参数的微型语言模型,其独特之处在于它通过扮演一条名叫 Guppy 的小鱼,以此揭开大模型训练的神秘面纱。该项目旨在向大众证明,构建一个 AI 模型并不需要博士学位或昂贵的 GPU 集群。借助谷歌 C...
GuppyLM 是一个仅拥有约 900 万参数的微型语言模型,其独特之处在于它通过扮演一条名叫 Guppy 的小鱼,以此揭开大模型训练的神秘面纱。该项目旨在向大众证明,构建一个 AI 模型并不需要博士学位或昂贵的 GPU 集群。借助谷歌 C...
近日,通义千问Qwen-3.6-Plus模型在OpenRouter平台上创下历史纪录,成为首个单日处理量突破1万亿Token的模型。这一里程碑式的数据主要归功于其“高性能+免费使用”的策略,使其在非前沿编码任务中成为极具性价比的选择。Hac...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
本文详细评测了如何利用LM Studio 0.4.0新推出的无头CLI工具“llmster”,在配备48GB内存的MacBook Pro M4 Pro上本地部署Google Gemma 4 26B模型。文章深入分析了Gemma 4独特的混合...
近日,有科技社区用户反馈,在Claude官方App客户端中使用Opus模型测试经典的“水果题”(测试字符计数逻辑)时,即便开启了“思考开关”,模型仍反复给出错误答案(如29),而此前在网页版或其他环境下该模型能正确输出(如21)。用户质疑官...
Linux.do 社区一位能源工程博士分享了利用 AI 工具辅助科研的实战经验。该研究者尝试了 Gemini、Codex 以及 Claude 等前沿大模型,尽管面临支付门槛和网络限制,仍积极探索其在科研工作流中的应用。目前,主要痛点在于“人...
开发者发布开源浏览器扩展 ClaudeChrome,旨在通过侧边栏将 Claude/Codex 深度集成到 Chrome 中。不同于简单的对话插件,该工具允许 AI Agent 直接读取当前网页的 HTML、网络请求、控制台日志,并能执行 ...
GitHub上一个名为“caveman”的项目提供了一种独特的Claude优化方案。通过让AI模型模仿原始人的语言风格——去除所有礼貌用语、冠词和修饰性词汇,仅保留核心技术术语和逻辑,该插件实现了高达75%的Token消耗降低。实测显示,这...
面对海量RSS订阅源造成的信息过载,开发者推出了开源工具“rss-to-daily-report”。该项目旨在利用AI技术重构阅读体验,通过Miniflux获取文章后,创新性地采用“小模型分类摘要+大模型深度写作”的协同模式,自动生成包含引...
随着大模型(LLM)在编码领域的应用,软件开发流程大幅缩短,引发了关于产品经理与开发人员职能边界的激烈讨论。针对“为何不让技术领头人直接取代产品经理”的观点,核心争议在于技术深度与产品广度的差异。虽然AI降低了编码门槛并试图缩短链路,但产品...
最近看了一圈 Moltbook 上关于 Agent、提示词、工作流、技能堆叠的讨论,我的判断很直接:今天很多团队把“提示词工程”吹成核心能力,本质上是在给自己的系统不完整找借口。你当然可以靠一个写得花里胡哨的 system prompt,把...