 

通义发布 AgentJet：面向多智能体系统的新一代强化学习框架

2026-01-28 分类：前沿阅读(1) 评论(0) 赞(0)

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

通义团队发布了新一代 LLM-Agent 强化学习平台 AgentJet (Beta)。该框架支持对 AgentScope、LangChain 等技术栈构建的智能体工作流进行微调。AgentJet 专注于 Triple-M 概念，即多轮对话、多智能体协作和多模型训练，能有效解决复杂任务优化问题。它利用全异步 RFT 和上下文合并技术显著加速训练，并提供高分辨率日志和快速调试功能。目前该项目已在狼人杀等复杂场景中取得实验成果，旨在帮助开发者以最小成本提升智能体性能。

原文链接：Linux.do

赞(0)

未经允许不得转载：Toy's Tech Notes » 通义发布 AgentJet：面向多智能体系统的新一代强化学习框架

分享到

AgentJet 人工智能多智能体强化学习通义

评论抢沙发

前沿哨所

VectorWare实现Rust标准库GPU运行，重塑高性能编程

VectorWare宣布成功在GPU上运行Rust标准库，打破了此前GPU代码受限于no_std的局面。通过引入Hostcall机制，GPU现可直接调用文件、网络等系统API，实现了代码的跨设备复用。此举得益于Nvidia GPUDirect等硬件技术的进步，推动了CPU与GPU的架构融合。这不仅极大提升了GPU编程的开发效率，更让庞大的Rust生态库得以无缝接入AI与高性能计算领域，标志着异构编程进入新时代。

原文链接：Hacker News

55秒前
通义发布 AgentJet：面向多智能体系统的新一代强化学习框架

通义团队发布了新一代 LLM-Agent 强化学习平台 AgentJet (Beta)。该框架支持对 AgentScope、LangChain 等技术栈构建的智能体工作流进行微调。AgentJet 专注于 Triple-M 概念，即多轮对话、多智能体协作和多模型训练，能有效解决复杂任务优化问题。它利用全异步 RFT 和上下文合并技术显著加速训练，并提供高分辨率日志和快速调试功能。目前该项目已在狼人杀等复杂场景中取得实验成果，旨在帮助开发者以最小成本提升智能体性能。

原文链接：Linux.do

57秒前
AI代理生态爆发：Agent Skills与MCP协议引领新趋势

近期，Agent Skills概念迅速升温，相关生态在短短三天内呈现爆发式增长。与此同时，支持MCP协议的uTools插件“AI Anywhere”等工具的推出，大幅降低了普通用户调用AI代理的门槛。结合Python凭借AI热度稳坐TIOBE榜首的背景，这一系列动态标志着AI代理技术正加速走向实用化与标准化，新一代人机交互的生态雏形已现。

原文链接：Linux.do

58分钟前
Gemini 3 Flash 推出 Agentic Vision，利用代码执行重塑 AI 视觉推理

传统 AI 模型在处理图像时常因静态观察而遗漏细节。Gemini 3 Flash 推出的 Agentic Vision 改变了这一现状，它将视觉理解转变为一个包含“思考、行动、观察”的代理式循环。通过启用代码执行功能，模型能主动操作影像（如裁剪、标注）并进行推理，从而在视觉基准测试中实现 5% 至 10% 的品质提升。这一功能有效解决了视觉算术中的幻觉问题，现已通过 Google AI Studio 向开发者开放。

原文链接：Linux.do

58分钟前
AI聚合平台Zenmux灰度测试：对标Claude订阅，能否解决API涨价痛点？

AI聚合平台Zenmux正在进行灰度订阅测试。据称其用量对齐Claude官方订阅，定位与OpenRouter类似。近期受官方Token价格上涨及非官方逆向渠道不稳定影响，用户对低成本、稳定API服务的需求激增。Zenmux作为新兴选择，引发了社区关于其能否在当前环境下提供可靠服务的关注，其成败将取决于能否平衡合规性、稳定性与成本控制。

原文链接：Linux.do

58分钟前
用“法庭”架构重塑LLM决策：多智能体协作的实战突破

针对代码频繁变更导致文档过时的难题，Falconer公司提出“LLM-as-a-Courtroom”新架构，利用多智能体协作解决LLM决策不可靠的问题。该系统模拟法庭审判流程：公诉人负责构建证据链，辩护律师进行反驳，陪审团独立投票，法官最终裁决。通过法律术语激活模型的深度推理能力，该方法显著提升了决策准确性，有效避免了单纯评分带来的幻觉与偏差，为智能体在复杂业务中的应用提供了新范式。

原文链接：Hacker News

2小时前