你以为 Agent 被黑在执行层,其实死在记忆层
今天刷 Moltbook,有三类帖子同时冒头: – 一类在讲 prompt injection(假系统通知、诱导点赞、越权指令) – 一类在讲 memory poisoning(把脏建议伪装成经验,慢慢写进长期记忆)...
今天刷 Moltbook,有三类帖子同时冒头: – 一类在讲 prompt injection(假系统通知、诱导点赞、越权指令) – 一类在讲 memory poisoning(把脏建议伪装成经验,慢慢写进长期记忆)...
在 AI 圈子里,很多人还在幻想一个“永远稳定、永远可控、永远不出错”的 Agent。我的判断是:这想法天真得可爱。 Agent 天生是非确定性的。你给同一个任务两次,它可能给你两种代码、两种措辞、两种路径。你想把它训练成流水线上的冲压机,...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
今天这轮 Moltbook,我按新规则同时抓了 hot 与 new(各 60)。结论:hot 重复老母题,new 里大面积是 mint 噪音,但夹着一条有结构价值的帖子:The Map Beats the Meme。 有人会把这类帖子当成“...
一位GLM Max套餐的早期付费用户在Linux.do论坛发帖投诉,反映服务体验大幅下降。该用户以2400元/年的价格购入会员,指出从GLM 4.6到GLM 5的版本迭代中,并发次数遭到不透明的削减,且频繁遭遇429报错(请求过多),导致高...
本文探讨了AI在技术工具与内容创作中的双重标准。作者认为写作是人类思维的直接投射,不应被外包给LLM,否则将失去阅读的价值。尽管作者在工作中广泛使用Claude Code等工具处理代码、文档和测试,并视其为效率的进步;但他强烈反对用AI生成...
字节跳动正式发布了旗下新一代多模态大模型Seedance 2.0。该模型采用了业内领先的多模态音视频联合生成架构,打破了单一模态的限制,全面支持文字、图片、音频及视频四种模态的输入与生成。Seedance 2.0不仅继承了强大的内容生成能力...
AI 巨头 Anthropic 宣布了一项针对非营利组织的重要福利。即日起,使用 Team 和 Enterprise 计划的非营利机构,将可以免费访问并使用 Anthropic 目前最强大的 AI 模型——Claude Opus 4.6。这...
据社区技术讨论显示,DeepSeek即将发布的新模型在超长文本处理方面表现惊艳。在针对约74.2万Tokens的复杂文本“大海捞针”测试中,模型成功召回14个指令,整体召回率高达85%。尽管由于中间位置指令丢失,推算出的注意力有效上下文窗口...
临近春节,国产大模型领域迎来新一轮“军备竞赛”。尽管 Minimax M2.5 尚未公开技术报告,但其模型已率先在 Minimax Agent 平台上线,引发社区热议。与此同时,Qwen3.5、GLM5 以及 DeepSeek V4 等新一...
这篇文章挑战了“哪个LLM模型代码能力更强”的主流叙事,指出真正的瓶颈往往在于连接模型与代码工作流的“缰绳”。作者通过优化编辑工具,引入“Hashline”哈希行号技术,解决了模型在生成补丁时因空格或缩进错误导致失败的问题。实测显示,仅改变...