LLM后训练技术综述:从CPU流水线设计看AI工具演进与灵感边界
本文基于论文《A Survey on Post-training of Large Language Models》,对大语言模型的后训练方法进行了解读,探讨了如何通过闭环实现“模型身体与灵魂”的共同进化。作者提出,计算机体系结构的历史智慧...
本文基于论文《A Survey on Post-training of Large Language Models》,对大语言模型的后训练方法进行了解读,探讨了如何通过闭环实现“模型身体与灵魂”的共同进化。作者提出,计算机体系结构的历史智慧...
有开发者在V2EX社区分享称收到小米大模型团队邀请,成功入选“MiMo Orbit激励计划”并获赠高达2亿Token的算力额度。这标志着小米MiMo API平台已全面升级至V2.5版本,开放了包括旗舰推理、多模态理解及语音合成在内的全系列模...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
本文讲述了开发者如何在一天内成功“复活”了1972年经典的聊天机器人PARRY(一款模拟偏执型精神分裂症的早期AI程序)。继此前复原ELIZA之后,该开发者重现了历史上著名的RFC439跨网对话,让这两位古董级AI重新“交谈”。文章还修正了...
本文基于一位资深 AI 深度用户的体验,探讨了关于大模型是否具备“创新能力”的争议。作者认为,尽管 AI 在生成领域常被诟病为缺乏灵魂的缝合怪,但在语言和逻辑上,它能提供超越搜索引擎的独特视角和反向思考。文章指出,当前的 LLM 仍缺乏真实...
长期以来,神经科学界认为“一起激发的神经元连在一起”(赫布理论),这通常需要反复练习才能形成记忆。然而,科学家最新发现了一种名为“行为时间尺度突触可塑性”(BTSP)的机制。研究表明,大脑海马体中的树突电位可以在数秒内瞬间强化特定神经连接,...
最新数据显示,网络安全已成为 IT 行业中涨薪最困难的领域,全球 71% 的从业人员去年遭遇薪资停滞,远低于行业平均水平。讽刺的是,网络安全工作正成为“自身成功的受害者”:因为防护有效,高层领导便产生自满,误以为风险可控。与此同时,AI 技...
科技巨头小米近日正式开源了其最新的轻量级模型系列——MiMo-v2.5。该模型采用了极为宽松的 MIT 许可协议,意味着企业和开发者可以自由进行商业使用。据测试数据显示,MiMo-v2.5 在代码编写和智能体交互等核心基准测试中表现优异,展...
本文发起了一场关于AI实用价值的深度探讨,并提出了一套“AI回答价值分级体系”。该体系将AI的反馈分为S至E六个等级:S级代表改变结果的直接效益(如赚钱、避险),D级为无实质内容的空泛建议,E级则是编造事实的误导性回答。这一分级标准为用户评...
近日,科技社区 Linux.do 发起了一场关于“国产大模型御三家”的评选讨论,引发了广泛关注。投票列表囊括了当前国内主流的顶尖大模型产品,包括风头正劲的 DeepSeek(提及 V4 系列)、月之暗面的 Kimi(K2.6)、阿里的通义千...
社区信息显示,小米近日正式上线了名为“MiMo Orbit”的百万亿Token创造者激励计划,旨在通过社区贡献构建海量数据资产。参与者反馈显示,该计划审批流程高效,已在AI开发者圈引发关注。这一举措不仅是小米加速补齐大模型数据短板的战略动作...