
大模型周刊 第 33 期:开源开始正面交锋,Anthropic 把招股书递了
作者:toy | 覆盖周期:2026.5.30 – 2026.6.5 这一周的关键词是”上场”。MiniMax 在 6 月 1 日把 M3 拍在桌上,1M 上下文、原生多模态、开源权重,SWE-Bench Pro 5...

作者:toy | 覆盖周期:2026.5.30 – 2026.6.5 这一周的关键词是”上场”。MiniMax 在 6 月 1 日把 M3 拍在桌上,1M 上下文、原生多模态、开源权重,SWE-Bench Pro 5...
一位来自技术社区的开发者分享了其耗时三天优化 DeepSeek 模型的实战经验。该开发者通过引入先进...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
近日,一篇题为《Harness-Bench》的论文(arXiv:2605.27922)通过严谨的基准...
这篇文章详细回顾了一名硕士研究生自 GPT-3 时代以来,利用大语言模型辅助科研工作的进化历程。起初...
2024年6月1日,多位开发者在技术社区反馈,GitHub Copilot 对个人账户实施了新的计费...
聚焦于大模型能力评测的社区平台“LDML排行榜”于6月1日进行了版本更新,重点引入了两款具有代表性的...
近日,随着MiniMax M3模型的发布,一位开发者在技术社区分享了其实战测评结果。该开发者将Min...
近日,开发者社区 Linux.do 上出现针对大模型厂商 Minimax 的强烈吐槽。一名开发者发帖...
OpenAI 与 Anthropic 近期针对开源项目维护者推出了新的福利计划,旨在通过提供免费的顶...
OpenAI 近期宣布扩大针对开源社区的扶持力度,正式向全球开源项目维护者免费赠送为期 6 个月的 ...
OpenAI 近日正式宣布了一项针对开源社区的重磅福利计划,向符合条件的开源项目维护者免费赠送 6 ...
一位开发者在技术论坛 Linux.do 发起讨论,对比了在 AI 编程场景下,两种不同工具链调用 D...

作者:toy 一、Agent 为什么需要记忆 无状态 LLM 的根本局限 把一个 LLM 想象成一位每隔五分钟就会彻底失忆的顾问。你在上午告诉他你的背景、偏好、当前项目的约束条件,五分钟后他已经一无所知,对话只能从头开始。这不是比喻,而是 ...
一位专注于 LaTeX 论文修改的开发者在技术社区分享了关于 Claude Code CLI(简称 ...
一位技术博主在 Linux.do 社区发布了一项关于大语言模型在网络安全实战中表现的对比测试。测试选...
开发者 kirenath 在 GitHub 上推出了名为 Vibebench 的开源项目,旨在通过实...
AI 编程智能体 IDE 工具 Kilo Code 近日在 X 平台发布了一份关于 Grok 模型的...

你可能听过一个直觉:C++ 比 Python 快很多倍,所以 llama.cpp(C++ 写的)应该比 vLLM(Python 写的)快很多倍。实测打脸——同一个模型同一张卡,vLLM 在不少场景下比 llama.cpp 还快。这就是 Ca...
近日,技术社区出现针对 Anthropic 旗下 Claude Code 及相关开发工具的负面反馈。...
近日,Meta AI 的“16 子代理”(16 Agents)联合搜索功能在技术社区引发关注。该模式...