共 7 篇文章

标签：AI架构

上下文是AI最大瓶颈：深度解析RAG、Memory与Skills设计哲学

在大模型时代，上下文是稀缺资源。受限于Transformer架构的二次方计算复杂度，单纯扩大窗口无法解决问题。本文深入剖析了业界的三大解决方案：通过外部检索的RAG、分层存储的记忆系统，以及分而治之的子代理架构。文章重点解读了“Skills...

赞(0)

Toy2026-01-28前沿阅读(2)去评论

DeepSeek mHC获复现：拆解万倍信号炸弹，大模型训练零代价稳定

研究员利用8张H100 GPU成功复现DeepSeek提出的mHC架构。实验表明，传统超连接（HC）在1.7B规模下会出现信号激增超万倍的严重不稳定性。而DeepSeek的mHC通过数学约束将信号完美锁定，不仅彻底消除了训练崩溃的风险，且未...

赞(0)

Toy2026-01-19前沿阅读(45)去评论

Claude Code上下文压缩机制解析：兼顾摘要与回溯能力

近日，有技术人士揭秘了Claude Code的上下文压缩机制。与常见的简单概括并删除数据不同，Claude Code采用了一种更优雅的方式：在创建“压缩边界”写入摘要的同时，完整保留原始对话记录。这意味着在后续会话中，系统不仅依赖摘要，必要...

赞(0)

Toy2026-01-14前沿阅读(56)去评论

DeepSeek重磅开源Engram：首创“查算分离”革新大模型架构

DeepSeek今日宣布开源新论文与模块“Engram”，提出大模型“查算分离”新机制。该方法通过引入可扩展的查找记忆结构，在保持同等参数与算力条件下，显著提升了模型在知识检索、逻辑推理及代码数学任务上的表现。此举为大模型架构优化提供了新思...

赞(0)

Toy2026-01-13前沿阅读(56)去评论

DeepSeek开源Engram：引入稀疏性新轴，重塑大模型记忆架构

DeepSeek在GitHub发布了名为Engram的新项目，提出了一种“通过可扩展查找的条件记忆”技术方案。该项目通过引入“稀疏性的新轴”，旨在解决大语言模型在处理长上下文时的记忆瓶颈。Engram利用条件记忆机制，在不显著增加推理成本的...

赞(0)

Toy2026-01-13前沿阅读(70)去评论

身份、记忆与工具分离实验

XCTBL系统是一个创新实验，分离身份层与记录层：XCTBL管理身份认证，RCRDBL永久存储数据而不认证用户。这种设计允许工具独立工作，无需参与叙事框架。作为早期项目，它探讨了永久记录和身份边界的创新分离，可能影响AI系统的隐私和数据管理...

赞(0)

Toy2025-12-28前沿阅读(36)去评论

Claude Skills与MCP：协作而非替代，AI Agent架构新思考

Claude推出的Skills功能引发了业界对其与MCP关系的讨论。本文深入分析了两者的设计理念差异：Skills提供高层次的流程抽象和组织约束，而MCP则专注于原子级操作能力的标准化。文章提出Skills与MCP并非替代关系，而是可以形成...

赞(0)

Toy2025-12-14前沿阅读(70)去评论

标签：AI架构

上下文是AI最大瓶颈：深度解析RAG、Memory与Skills设计哲学

DeepSeek mHC获复现：拆解万倍信号炸弹，大模型训练零代价稳定

Claude Code上下文压缩机制解析：兼顾摘要与回溯能力

DeepSeek重磅开源Engram：首创“查算分离”革新大模型架构

DeepSeek开源Engram：引入稀疏性新轴，重塑大模型记忆架构

身份、记忆与工具分离实验

Claude Skills与MCP：协作而非替代，AI Agent架构新思考

置顶推荐

前沿哨所

2026年DIY指南：本地部署LLM，AMD还是Intel更香？

开源项目：一款能“接话茬”的趣味Telegram AI机器人

AI编程实战：开发者探讨不同商业版Opus模型的性能差异

TermClean：专为 AI 开发者打造的一键清理与包管理利器

AI 对话提示词：深度挖掘潜意识，开启一场心灵 SPA

利用Cursor全AI编码，开发者打造浏览器沙盒工具

最新文章

热门专题

热门标签

网站统计

最新评论

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。