社区热议 Claude 新版文学表现:思考变长却“GPT化”,创造力优势不再?
近期社区用户对比测试发现,Claude 最新版本(文中称 4.7)在文学创作领域的表现引发了争议。相比旧版本,新模型虽然思考耗时显著增加,但输出质量并未随之提升,甚至被批评出现了类似 ChatGPT 的刻板表达风格。尽管其综合能力仍属第一梯...
近期社区用户对比测试发现,Claude 最新版本(文中称 4.7)在文学创作领域的表现引发了争议。相比旧版本,新模型虽然思考耗时显著增加,但输出质量并未随之提升,甚至被批评出现了类似 ChatGPT 的刻板表达风格。尽管其综合能力仍属第一梯...
本文分享了一篇入选ICLR 2026的论文CS-Aligner,直击当前CLIP类模型的痛点:仅靠InfoNCE损失函数会导致图文特征在空间分布上产生明显的“模态鸿沟”。CS-Aligner创新性地引入柯西-施瓦茨(CS)散度作为额外监督项...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
DeepSeek多模态研究员、北京大学博士陈小康近日在社交媒体X上透露,DeepSeek即将推出全新的多模态模型。作为近期在AI开源社区极具影响力的团队,DeepSeek此前发布的代码和模型已引发行业震动。陈小康的此番发声引发了技术社区的广...
本文作者详细记录了在配备8张NVIDIA A100(单卡40G显存,NVLink互联)的服务器上,本地部署DeepSeek V4 Flash模型的技术路径。鉴于主流工具Ollama尚未提供支持,作者采用了社区开发者nisparks修改的Ll...
近日,有开发者在技术社区反馈,已成功通过 Xiaomi MiMo 百万亿(100T)Token 创造者激励计划,并获得了高等级的“Max套餐”算力支持。该开发者表示,此前在开源项目中使用的 Hermes 和 OpenClaw 等小米大模型表...
小米近日启动了名为“Xiaomi MiMo Orbit”的百万亿Token创造者激励计划,旨在吸引全球开发者加入其AI生态。该平台向用户限时发放高达100T Credits的算力资源,个人额度可达16亿Token,有效期一个月。开发者可通过...
关于国内开源大模型面临的新挑战引发了行业热议。通常情况下,国内厂商想通过蒸馏国外闭源大模型(如GPT-4)来优化自身模型,往往面临高昂的成本和严格的API限制。然而,局势却呈现不对称性:国内厂商发布的高质量开源模型,可被国外闭源巨头零成本获...
针对大语言模型(LLM)推理响应缓慢导致的用户流失风险,Hacker News展示了一种新颖的解决方案:在AI生成结果的加载间隙,为用户提供一个可游玩的即时小游戏。这一创意利用游戏化机制填补了模型推理的“空窗期”,有效缓解用户等待焦虑,将原...
针对《红楼梦》、《权力的游戏》等因各种原因未能完结的著名小说,本文探讨了利用大模型技术进行“完美续写”的可行性。不同于简单的机械续写,提出了一种进阶思路:利用AI深度学习原作者的全部文字作品以精准模仿其笔触,同时整合互联网上海量的网友书评与...
小米正式宣布将 MiMo-V2.5 及 Pro 版本模型在全球范围内开源,采用 MIT 协议,允许商用与二次开发。同时启动“MiMo Orbit”计划,宣布将在30天内面向全球开发者发放总计100万亿Token的免费权益,以算力补贴吸引AI...