MiniMax团队发布了名为MaxProof的创新框架,旨在通过“群体级测试时扩展”技术解决竞赛级数学证明难题。该研究隶属于MiniMax-M3系列,其核心在于通过深度防御生成式验证器,训练模型获得证明生成、证明验证以及基于批评的证明修复三种核心能力。在推理阶段,MaxProof将单一模型转化为生成器、验证器、精炼器和排序器的集合体,通过搜索候选证明群体并利用锦标赛筛选机制,从海量候选中锁定最终证明。实验结果显示,该模型在国际数学奥林匹克竞赛(IMO)2025的题目中取得了35/42的优异成绩,并在美国数学奥林匹克竞赛(USAMO)2026中获得36/42的分数,这两项成绩均超过了人类金牌获得者的门槛。这一成果标志着大模型在复杂逻辑推理和高难度数学问题求解上取得了显著突破,验证了强化学习与验证机制相结合的有效性。
事件分析
💡 核心观点:MaxProof通过生成验证协同与群体搜索范式证明,AI在高强度逻辑推理任务上已具备超越顶尖人类专家的系统性能力。
原文链接:Hacker News







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战