 

Trinity Large 登场：400B 稀疏 MoE 模型，宣称超越 Llama 4

2026-01-29 分类：前沿阅读(1) 评论(0) 赞(0)

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

Trinity 团队发布 4000 亿参数稀疏 MoE 模型 Trinity Large，采用 4-of-256 架构，仅激活 13B 参数，推理速度提升 2-3 倍。该模型提供 Base、Preview 和 TrueBase 三个版本，其中 Preview 版在 MMLU 上超越 Llama 4 Maverick。即将推出的推理版在数学测试中表现惊艳。目前该模型已开源并在 OpenRouter 上线。

原文链接：Linux.do

赞(0)

未经允许不得转载：Toy's Tech Notes » Trinity Large 登场：400B 稀疏 MoE 模型，宣称超越 Llama 4

分享到

评论抢沙发

前沿哨所

Trinity Large 登场：400B 稀疏 MoE 模型，宣称超越 Llama 4

Trinity 团队发布 4000 亿参数稀疏 MoE 模型 Trinity Large，采用 4-of-256 架构，仅激活 13B 参数，推理速度提升 2-3 倍。该模型提供 Base、Preview 和 TrueBase 三个版本，其中 Preview 版在 MMLU 上超越 Llama 4 Maverick。即将推出的推理版在数学测试中表现惊艳。目前该模型已开源并在 OpenRouter 上线。

原文链接：Linux.do

27秒前
GitHub开源精简版AI编程工具，大幅降低Token消耗

针对开发者在使用AI编程工具时面临的高昂Token成本问题，GitHub社区推出了名为“oh-my-opencode-slim”的精简版项目。该工具对原版进行了深度清理与精简，旨在显著降低Token消耗。版本集成了Exa网络搜索、context7和grep.app三个MCP组件，并默认配置Orchestrator，足以满足大多数开发需求。这一优化为开发者提供了更高效、更轻量级的解决方案。

原文链接：Linux.do

29秒前
AionUi接入Telegram：实现远程控制本地AI Agent

AionUi发布v1.7.8版本，正式接入Telegram远程通道，用户现可通过即时通讯软件远程操控本地AI Agent干活。该功能基于Gemini CLI Agent构建，配置流程极简，实现了移动端与WebUI的多端消息同步。这一更新打破了本地AI工具的空间限制，利用Telegram的高渗透率，为个人AI Agent提供了随时可用的远程控制入口，极大地提升了工具的实用性与互动性。

原文链接：Linux.do

36秒前
开源记忆层赋能：memUbot打造低成本全天候主动AI智能体

团队发布了新一代 AI 智能体 memUbot，旨在实现真正“全天候主动”的服务体验。该智能体能持续记录构建长期记忆，随着时间推移理解用户习惯与上下文，不再仅依赖 Prompt，而是能主动推断意图并在用户开口前行动。在工程实现上，memUbot 通过将上下文存储于记忆层，大幅减少 LLM 调用次数，显著降低了长期运行成本。此外，团队开源了核心记忆层 memU，可赋能其他智能体实现低成本升级。

原文链接：V2EX 分享发现

52秒前
开源新工具：基于 Gemini 的短视频与漫画 AI 制作神器

社区开源了一款基于 Google Gemini 的短视频及漫画制作工具。该工具集成了 nano banana 和 VEO 模型，用户需自行配置 API_KEY 并支持第三方供应商接口。目前支持本地部署，虽仅在 macOS 上经过测试，但其他系统理论上也可兼容。该工具为开发者和创作者提供了利用前沿模型进行内容创作的便利。

原文链接：V2EX 分享发现

55秒前
Aether：统一管理多 AI 服务的自托管网关

本文介绍了开源项目 Aether，这是一个自托管的 AI API 网关。作者通过实际使用演示了如何利用 Aether 解决多公益站点 AI 服务配置繁琐、可用性不稳定的问题。文章详细阐述了从模型管理、提供商添加、API 端点配置到模型映射及独立密钥生成的完整流程，并提及了 New API 签到等附加功能，为需要统一管理各类 AI 模型的用户提供了实用指南。

原文链接：Linux.do

1分钟前