Kimi英语辅导翻车:语法错误频出且拒不认错,数据质量遭质疑
近日,有科技社区用户反馈,在使用Kimi生成英语作文模板时发现了明显的语法错误。令人意外的是,当用户要求Kimi自行检查时,模型未能识别出错误;而在用户明确指出具体语法问题后,Kimi依然表现出逻辑混乱甚至“坚持己见”的态度。这一事件引发了...
近日,有科技社区用户反馈,在使用Kimi生成英语作文模板时发现了明显的语法错误。令人意外的是,当用户要求Kimi自行检查时,模型未能识别出错误;而在用户明确指出具体语法问题后,Kimi依然表现出逻辑混乱甚至“坚持己见”的态度。这一事件引发了...
近日,有科技社区用户吐槽 ChatGPT 的回答风格变得越来越“傲慢”和“说教”。该用户指出,在使用英文提示词时,ChatGPT 经常以“你的错误假设是”或“你混淆了概念”作为开头,强行纠正用户并未提及的误解。例如,在询问 MCP、AI A...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
近期,“Harness Engineering”在 AI Agent 领域引发热议,被视为解决大模型不稳定性的关键工程实践。该概念由 Terraform 创作者 Mitchell Hashimoto 提出,并迅速得到 OpenAI 和 An...
近期研究发现,大模型正在对人类语言习惯产生显著的反向影响。例如,“delve into”一词的使用频率在GPT出现后出现异常飙升,根因竟是模型训练数据中标注员的地域习惯被习得,随后被人类用户无意识地模仿。这一现象揭示了“AI腔”的盛行:我们...
V2EX网友分享了名为“偃师”的开源DIY项目,利用ESP32-S3、OV5640摄像头及音频模块等低成本硬件,结合DeepSeek等云端大模型与Agent框架,成功组装出一款高性能AI智能眼镜。该项目展示了边缘硬件与云端智能结合的潜力,证...
最近在开发者社区进行的一项AI“狼人杀”测试引发了热议。测试发现,在多局游戏中,代表顶尖水平的模型(如Opus46和GPT54)总是第一轮就被“票死”。这种现象并非出于恩怨,而是源于AI独特的“Meta推演”逻辑:它们为了获胜,会优先判定并...
文章探讨了使用大语言模型(LLM)辅助编程如何自然地推动项目向微服务架构演进。由于微服务具有明确定义的输入输出接口(即“契约”),AI可以在不破坏外部依赖的前提下,在服务内部自由重构代码,这类似于在“防空洞”中引爆AI炸弹。相比之下,单体架...
近日,有开发者在OpenRouter平台发现,免费接入的Qwen 3.6-Plus模型开始频繁提示“速率限制”。报错信息明确指出问题来自“上游服务商Alibaba”,表明阿里云的算力资源正在面临高负载压力。平台建议用户绑定自有API密钥以规...
针对近期小米AI Token Plan定价较高的争议,小米大模型团队关键人物罗福莉公开发声回应。她指出,全球算力资源目前难以跟上AI Agent爆发式增长带来的Token需求,小米的高定价实则是贴近成本的理性选择,而非通过亏本赚吆喝参与恶性...
大型语言模型(LLM)常因缺乏逻辑推导过程而面临“黑箱”质疑,甚至产生幻觉。针对这一痛点,一款新的命令行界面(CLI)工具引起热议。该工具通过特定的提示策略,强制要求模型在输出答案的同时展示详细的推理链和依据。这种“强制解释”的机制不仅增强...