 

DeepSeek开源Engram：引入稀疏性新轴，重塑大模型记忆架构

2026-01-13 分类：前沿哨所阅读(5) 评论(0) 赞(0)

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

DeepSeek在GitHub发布了名为Engram的新项目，提出了一种“通过可扩展查找的条件记忆”技术方案。该项目通过引入“稀疏性的新轴”，旨在解决大语言模型在处理长上下文时的记忆瓶颈。Engram利用条件记忆机制，在不显著增加推理成本的前提下，大幅提升了模型检索和记忆关键信息的能力。这一创新为大模型架构优化提供了新思路，有望推动更高效、更低成本的AI应用落地，对行业具有极高的参考价值。

原文链接：Linux.do

赞(0)

未经允许不得转载：Toy's Tech Notes » DeepSeek开源Engram：引入稀疏性新轴，重塑大模型记忆架构

分享到

AI架构 deepseek 大语言模型记忆机制

评论抢沙发

前沿哨所

Agent-of-empires：开源AI编程会话管理器，提升终端效率

Agent-of-empires是一款基于Rust开发的终端会话管理器，旨在优化Linux和macOS平台上的AI编程代理管理体验。该工具通过封装tmux，为Claude Code和OpenCode等AI编码工具提供可视化仪表盘、多会话管理、分组组织及状态监控功能。它支持多配置文件隔离，帮助开发者在复杂项目中高效管理AI编码流程，提升终端环境下的生产力。

原文链接：Hacker News

58分钟前
Claude推出Cowork工具：将Agent能力扩展至文档协作

Claude正式发布名为Cowork的新工具，将其原本的Agent代码能力扩展至大众用户。用户可授权Claude访问本地文件，让其自动执行组织、创建及编辑文档等任务。这一举措旨在将用户从繁琐的文件处理中解放出来，专注于核心事务，标志着AI Agent正从代码领域向通用生产力工具全面渗透。

原文链接：Linux.do

58分钟前
双模型协作应用Dual AI Chat V2：通过AI互辩生成更优答案

Dual AI Chat V2 是一款基于 React 19 的创新 AI 聊天应用。它采用“协作智能”模式，让逻辑型 AI 与创意型 AI 针对用户问题进行内部辩论和提炼，从而生成比单一模型更准确、严谨的答案。目前支持 Google AI Studio 免费体验及 GitHub 开源部署。

原文链接：Linux.do

58分钟前
严重漏洞！AI编程助手OpenCode允许未授权远程执行代码

开源AI编程助手OpenCode被曝存在严重的未授权远程代码执行漏洞。在v1.1.10版本前，软件会自动启动一个无身份验证的Web服务器，允许任意连接方执行Shell命令或读取文件。尽管新版已默认禁用服务器，但若手动开启，本地进程或恶意网页仍可利用此漏洞完全控制用户机器，建议立即更新并检查配置。

原文链接：Hacker News

2小时前
Qwen新模型实现单图3D视角控制，上传图片即可任意旋转

近日，基于Qwen Image Edit 2511模型开发的3D相机控制工具引发关注。该工具允许用户上传任意图片，通过调整左右角度、上下角度及距离参数，生成图片的3D多视角视图。用户只需在Hugging Face空间中上传照片，利用交互式3D查看器或滑块即可轻松改变观察角度，例如将正面图转为侧面图。这一技术为AI图像编辑提供了更强大的空间控制能力，展现了多模态AI在视觉生成领域的最新进展。

原文链接：Linux.do

2小时前
3D图形优化：利用SIMD提升AABB性能的技巧

本文探讨了3D图形编程中轴对齐包围盒（AABB）的内存布局优化策略。相比传统的分别存储最小值和最大值，采用交错存储坐标的方式能显著提升数据局部性。这种结构设计更利于SIMD指令集并行处理，允许同时加载并检查三个维度的坐标，从而大幅提升碰撞检测与渲染效率，对高性能计算至关重要。

原文链接：Hacker News

3小时前