探秘 AI 内部机制:大语言模型究竟如何产生“情绪”?
本文深入探讨了大型语言模型(LLM)内部处理“情绪”的机制。研究者通过分析 Transformer 架构的电路图,发现模型并非仅仅是简单地模仿人类的情绪语言,而是真的在内部形成了特定的“情绪概念”神经元。这些情绪特征在模型处理对话、角色扮演...
本文深入探讨了大型语言模型(LLM)内部处理“情绪”的机制。研究者通过分析 Transformer 架构的电路图,发现模型并非仅仅是简单地模仿人类的情绪语言,而是真的在内部形成了特定的“情绪概念”神经元。这些情绪特征在模型处理对话、角色扮演...
随着AI技术的深入应用,数学建模领域正迎来全流程自动化变革。本文基于开源项目MathModelAgents,探讨了如何构建包含主导者、模型手、软件手和论文手的多智能体协作系统。文章分析了不同大模型(如GPT系列与Gemini)在上下文记忆、...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
本文针对AI生成内容中普遍存在的“欧式中文”(翻译腔)问题,对Grok 4.2、Gemini 3 Pro及Claude Opus三款顶尖大模型进行了横向评测。测试重点考察模型对长定语、倒装句等典型西化中文的识别与修改能力。结果显示,Clau...
Hacker News上关于“在家组装AI机器人”的讨论引发了广泛关注。一方面,随着大模型(LLM)能力的提升,利用本地算力复活旧硬件或构建类似Mycroft的开源助手成为可能,技术门槛正在降低。另一方面,社区对AI进入家庭表达了深切的伦理...

那篇文章戳到了什么 前几天 Andrej Karpathy 在 GitHub 上发了一篇叫 LLM Wiki 的短文。我读完之后坐在椅子上想了大概十分钟。 不是因为他讲了什么新技术,而是因为他把一个我一直在做但从来没想清楚的事情,说得太透了...
GitHub 上涌现了一个名为 Rikune 的开源项目,这是一个专为 Windows 逆向工程设计的 MCP(模型上下文协议)服务器。该项目旨在将 Ghidra、Frida、Rizin 等复杂的底层安全工具转化为 LLM 可直接调用的标准...
近日,科技社区Linux.do引发热议,讨论焦点集中在大模型DeepSeek的最新进展。观点指出,DeepSeek在SVG(可缩放矢量图形)生成能力上实现了显著突破,这被视为构建下一代PPT智能体的关键“拼图”。不同于传统的图片调用,Dee...
社区反馈显示,DeepSeek正在小范围灰度测试“专家模式”功能。经过初步实测,该模式在回答质量上优于默认的“快速模式”,但性能提升幅度较为有限,未带来质的飞跃。当被问及差异来源时,模型自身暗示这主要源于系统提示词(System Promp...
近日,多名开发者在技术社区反馈,智谱 GLM 系列模型在日常调用中出现严重的 429 限流报错,导致基于 NewAPI 的服务几乎无法正常运行。尽管国内算力资源看似充足,但针对性的限流策略引发了用户对厂商资源分配的质疑。对比测试显示,切换至...
近日,有社区用户在测试DeepSeek的“专家模式”时发现了一个有趣的现象:当仅通过纯文本询问“这是什么模式”时,模型并未准确回答模式定义,而是错误地开始“描述”一张并不存在的图片,仿佛患上了视觉幻觉,出现了“虚空读图”的Bug。这一故障引...