普林斯顿 AI Lab Fellow、前字节跳动研究员 Yifan Zhang 近日透露,中国 AI 独角兽 DeepSeek 的下一代旗舰模型 V4 可能于下周发布。尽管 DeepSeek 官方尚未回应,但 Zhang 凭借其清华姚班及普林斯顿的学术背景,披露了三项核心架构组件:稀疏 MQA(优化长上下文算力)、融合 MoE 大核(减少 GPU 显存搬运)及 Hyper-Connections(改进残差连接)。这些技术从底层算子层面解决 LLM 推理的显存与延迟瓶颈,预示着 V4 将在保持高性能的同时进一步大幅降低部署成本。
原文链接:Linux.do








AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战