 

刷新医疗 AI 天花板：百川 Baichuan-M3 发布，实测超越 OpenAI 最新模型

2026-01-13 分类：前沿哨所阅读(4) 评论(0) 赞(0)

百川智能推出新一代医疗强化大模型 Baichuan-M3。不同于传统模型，它专注于临床决策过程的显式建模，通过 Fact-Aware 强化学习显著降低幻觉率。在 HealthBench、SCAN-bench 等多项权威评测中，Baichuan-M3 表现卓越，特别是在临床询问、化验检测和诊断三个维度均排名第一。数据显示，其性能不仅大幅超越前代，更在关键指标上优于 OpenAI 最新模型，确立了医疗 AI 领域的新 SOTA 水平。

原文链接：Linux.do

赞(0)

未经允许不得转载：Toy's Tech Notes » 刷新医疗 AI 天花板：百川 Baichuan-M3 发布，实测超越 OpenAI 最新模型

分享到

Baichuan-M3 医疗 AI 大模型幻觉率百川智能

评论抢沙发

前沿哨所

开发者推出场景化 AI 提示词库 SkillNest，解决检索痛点

针对开发者在使用 Claude 和 ChatGPT 时面临的提示词零散、难以检索的问题，一位开发者创建了名为 SkillNest 的新网站。该项目摒弃了传统的列表式收集，转而依据“使用场景”对 GitHub 等地的 AI Skills 进行深度整理与重构。这一举措旨在通过场景化分类，帮助用户快速定位所需技能，从而显著缩短查找时间，提升 AI 辅助开发与写作的效率。

原文链接：V2EX 分享发现

38分钟前
英国构建“预防犯罪”系统：AI预测执法与异议管控

英国正通过算法和面部识别技术构建“预防犯罪”体系。尽管犯罪率长期下降，但警方正转向数据驱动监控。司法部开发的“谋杀预防”系统试图通过多部门数据预测个体暴力风险。配合2025年犯罪与警务法案，警方获取驾照记录可能助长生物识别追踪。这些技术被指存在种族偏见，并主要针对工人阶级社区。监控重心正从打击街头犯罪转向管控抗议和政治异议，旨在未来动荡爆发前进行预先压制。

原文链接：Hacker News

38分钟前
OpenAI整顿账号生态：大量Team账号遭封禁，12月注册成重灾区

据社区反馈，OpenAI近期对违规账号展开大规模整顿，集中封禁了大量ChatGPT Team订阅账号。此次行动精准打击特定时段（特别是2023年12月20日左右）注册的账号，引发开发者广泛关注。这标志着OpenAI正收紧审核机制，严厉打击灰色产业链，对依赖低成本共享方案的开发者及初创企业造成直接冲击。

原文链接：Linux.do

38分钟前
Sora封禁科比生成：AI伦理边界下的“赛博永生”幻灭

用户发现OpenAI的文生视频模型Sora已无法生成与已故篮球巨星科比·布莱恩特相关的视频内容。这一现象揭示了AI模型在商业化落地过程中，日益严格的安全护栏与审查机制。尽管“数字永生”曾被视作AI技术的浪漫愿景，但面对公众人物的隐私保护及伦理争议，技术平台被迫在创作自由与社会责任之间划清界限，AI内容的合规性已成为不可逾越的红线。

原文链接：Linux.do

38分钟前
Antigravity IDE 增强补丁 1.2.0：新增 Mermaid 渲染与一键复制

GitHub 社区推出了针对 Antigravity AI IDE 的开源增强补丁，用户只需替换文件并重启即可使用。最新发布的 1.2.0 版本重点新增了 Mermaid 流程图渲染功能。此前版本已实现 LaTeX 公式渲染、悬浮复制按钮及表格颜色修复。该补丁通过不断优化渲染效果和交互细节，显著提升了开发者的使用体验和效率。

原文链接：Linux.do

39分钟前
Windows原生运行：Rust 轻量级交叉编译工具发布

开发者发布了一款名为 cargo-cross 的 Rust 交叉编译工具，允许在无需 WSL、Docker 或 Colima 等虚拟化环境的情况下，直接在 Windows、macOS 或 Linux 上为异构平台构建二进制文件。该工具支持多平台互编译及自定义 glibc 版本，有效降低了跨平台开发的环境配置成本。

原文链接：V2EX 分享发现

2小时前