本文报道了谷歌Gemini 3 Flash模型在大模型竞技场上的捞针测试结果。测试显示,在70K输入范围内,模型准确率达到100%,相比Gemini 3 Pro有显著进步。然而,整体性能趋势与Gemini 2.5 Pro高度相似,推测3 Flash可能是2.5 Pro家族的后续版本。具体数据包括:70K上下100%,80K 95%,90K 87%,100K 60%,110K 42%。社区实际使用体验与Wolfstride模型相近。测试因反代渠道受限,作者手动捕捉数据。这些发现为AI从业者提供了模型性能的实用洞察。
原文链接:Linux.do
最新评论
照片令人惊艳。万分感谢 温暖。
氛围绝佳。由衷感谢 感受。 你的博客让人一口气读完。敬意 真诚。
实用的 杂志! 越来越好!
又到年底了,真快!
研究你的文章, 我体会到美好的心情。
感谢激励。由衷感谢
好久没见过, 如此温暖又有信息量的博客。敬意。
很稀有, 这么鲜明的文字。谢谢。