DeepSeek V4 测试引热议:面对模糊指令拒绝瞎猜,展现“不懂就问”的真推理能力
近日,DeepSeek V4 模型在一次逻辑测试中表现出色。当面对“容器R里有几个草莓”这一定义模糊的难题时,该模型没有像以往的大语言模型那样强行“过拟合”或产生幻觉给出答案,而是主动反问用户“R”的具体定义。这种“不懂会问”的交互方式,被...
近日,DeepSeek V4 模型在一次逻辑测试中表现出色。当面对“容器R里有几个草莓”这一定义模糊的难题时,该模型没有像以往的大语言模型那样强行“过拟合”或产生幻觉给出答案,而是主动反问用户“R”的具体定义。这种“不懂会问”的交互方式,被...
近日有开发者在社区反馈,DeepSeek模型在处理一项复杂的字符串解码任务时出现异常,思考时间超过2分钟仍无任何输出,且Web端与API端均存在该问题。在同等测试条件下,GPT与豆包虽未给出正确答案,但能快速响应并给出结果,仅有Gemini...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
社区针对DeepSeek-V4模型进行了编码能力实测,发现初期测试结果平平实则是配置不当所致。核心解决方案在于将环境变量 `CLAUDE_CODE_EFFORT_LEVEL` 设为 `max`,并确保所有子代理模型均指向 `deepseek...
AI独角兽DeepSeek在GitHub提前发布了完全重构的专家并行通信库DeepEP v2。新版本旨在解决初代产品的技术债务,在延续V3配置的测试中,不仅将峰值性能提升至1.3倍,更将GPU流处理器资源占用降低了4倍。架构上,v2版弃用N...
最近一项针对 DeepSeek 模型的代码能力测试引发关注。测试者利用复杂的自然语言提示词,要求 AI 扮演 Apple 设计师,编写包含完整 HTML、CSS 和 JavaScript 的单文件。结果显示,DeepSeek 成功复刻了 i...
随着DeepSeek新模型的发布,社区中出现了一些针对其适配国产算力(特别是华为昇腾芯片)的嘲讽声音。然而,网友指出,智谱AI的GLM系列同样基于10万张华为昇腾910B芯片进行训练,并广泛支持华为昇腾、海光、寒武纪等多种国产算力卡进行推理...
一位开发者在社区分享了使用DeepSeek(文中提及v4pro)的深度体验。测试中,该模型在极短时间内阅读了20篇论文,并自动生成了包含思维导图和HTML页面的完整报告。此外,它还成功解答了关于Flatpak打包中DNS解析失败的具体技术难...
近日,有开发者在社区实测DeepSeek时遭遇“账单惊魂”:仅通过一个简单的“Hi”问候和分析指令,模型竟进行了长达11分41秒的推理过程,最终产生4.13元人民币的费用。尽管DeepSeek以极低的API单价闻名,但此事暴露了推理模型(如...
DeepSeek发布了全新的V4系列模型,其核心突破在于攻克了高效能的百万级Token上下文处理技术。这一进展使得AI模型能够一次性“吞下”并理解海量数据(如长篇小说、大型代码库或复杂的自动驾驶日志),同时显著降低了长文本推理的计算成本。D...
据社区消息,DeepSeek与华为昇腾的绑定正在显著加深。随着今年下半年昇腾950超节点算力集群上市,DeepSeek Pro模型价格有望进一步大幅下降。DeepSeek创始人曾表示,成本降低是技术探索和工程优化的副产品。尽管市场曾担忧国产...