近日,DeepSeek V4 模型在一次逻辑测试中表现出色。当面对“容器R里有几个草莓”这一定义模糊的难题时,该模型没有像以往的大语言模型那样强行“过拟合”或产生幻觉给出答案,而是主动反问用户“R”的具体定义。这种“不懂会问”的交互方式,被网友认为是模型具备了初步逻辑推理能力、区别于传统“瞎猜”模型的重要标志,展示了 AGI 发展的又一可能性。
原文链接:Linux.do
近日,DeepSeek V4 模型在一次逻辑测试中表现出色。当面对“容器R里有几个草莓”这一定义模糊的难题时,该模型没有像以往的大语言模型那样强行“过拟合”或产生幻觉给出答案,而是主动反问用户“R”的具体定义。这种“不懂会问”的交互方式,被网友认为是模型具备了初步逻辑推理能力、区别于传统“瞎猜”模型的重要标志,展示了 AGI 发展的又一可能性。
原文链接:Linux.do
大模型周刊 第 31 期:Mythos 把网安炸到震耳,Hermes 抢下 OpenRouter 日榜,DeepSeek V4 落地后继续杀价