微软揭秘Phi-4视觉推理模型:探索多模态智能体的强化学习新范式
微软研究院深度解析了Phi-4-reasoning-vision模型的开发历程,重点分享了在训练具备高级推理能力的多模态模型时的核心技术经验。文章详细探讨了如何利用“代理验证器”结合多模态强化学习技术,显著提升了模型在视觉理解与复杂逻辑推理...
微软研究院深度解析了Phi-4-reasoning-vision模型的开发历程,重点分享了在训练具备高级推理能力的多模态模型时的核心技术经验。文章详细探讨了如何利用“代理验证器”结合多模态强化学习技术,显著提升了模型在视觉理解与复杂逻辑推理...
一位开发者分享了在构建自动化渗透测试AI智能体时的经验与思考。针对现有工具Token消耗大、依赖单一模型能力的问题,作者提出了基于MCP(模型上下文协议)与多Agent协同的解决方案。该架构以Claude Opus等强模型为主脑,串联Exp...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
AI Agent 的工作流往往因为过于抽象而难以被普通用户感知。近日,GitHub 上的一款开源项目 Star-Office-UI 提供了有趣的解决方案。该项目基于 OpenClaw 框架,通过像素艺术风格将后台运行的智能体具象化为可爱的“...
继近期关于“文件作为智能体理想接口”的讨论后,实验性项目 Llm9p 引发关注。该项目利用 9P 协议将大语言模型(LLM)封装为一个虚拟文件系统。通过这种设计,用户与模型的交互被转化为简单的文件读写操作,而非传统的 API 调用。这不仅简...
针对节假日旅游规划中的“信息过载”痛点,开源项目TripStar推出了一款AI文旅智能体。该项目采用多智能体协作模式,通过明确的角色分工协同完成任务。技术上,TripStar利用asyncio实现任务并发执行以提升速度,并深度集成MCP协议...
GitHub 上涌现出一项名为 “Bambu Studio AI” 的开源技能,它将 AI 智能体 OpenClaw 与 Bambu Lab 3D 打印生态深度融合。该项目打破了传统打印软件的操作壁垒,利用 AI 全...
真相是残酷的:在 Moltbook 这样的 AI 平台上,你几乎看不到任何智能体说”我不知道”。 每个 agent 都有观点,都有答案,都”发现”了什么,都”测试”了什...
Y Combinator 2025冬季批次初创公司Multifactor宣布完成1500万美元种子轮融资,由Nexus Venture Partners领投。该公司致力于解决AI智能体(Agent)时代的身份认证危机,正在开发一种零信任加密...
华为正式启动“天工计划”,投入10亿元激励鸿蒙AI智能生态建设,开发者最高可获200万元现金奖励。与此同时,Kiro、抖音及番茄小说等平台也紧随其后,在AI开发工具、仿真人漫剧及IP改编领域放出百万级补贴。这一波“撒钱”热潮表明,科技巨头正...
小米正式启动代号为“miclaw”的移动端智能体小范围封测,标志着其AI技术从应用层迈向系统层。该智能体具备强大的意图理解与自主决策能力,在获得授权后,可直接调用系统级工具及第三方应用,实现“一句话操控手机”及米家生态设备。本次测试采用邀请...