国产大模型陷入“刷量”疑云:MiniMax、Kimi等数据真实性遭质疑
近期一份针对AI模型聚合平台OpenRouter的数据分析引发了行业热议。该分析以DeepSeek的流量作为真实用户使用的基准,对比发现MiniMax、Kimi及智谱GLM等国内大模型的调用量远超其理论预期,其中MiniMax的实际流量甚至...
近期一份针对AI模型聚合平台OpenRouter的数据分析引发了行业热议。该分析以DeepSeek的流量作为真实用户使用的基准,对比发现MiniMax、Kimi及智谱GLM等国内大模型的调用量远超其理论预期,其中MiniMax的实际流量甚至...
本文探讨了如何将有色佩特里网(Colored Petri Nets)这一经典的数学建模技术引入LLM与分布式应用领域。作者指出,尽管LLM具备强大的生成能力,但在处理涉及复杂状态流转和并发控制的分布式任务时往往缺乏确定性。通过结合佩特里网的...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
本文介绍了一种利用Libvirt和Virsh在虚拟机中运行大型语言模型(LLM)智能体的技术方案,旨在解决AI Agent执行不可预测代码时的安全隐患。通过构建“Safe YOLO模式”,文章探讨了如何利用虚拟化环境实现严格的资源隔离,防止...
作者在搜索一款冷门游戏时,发现一篇文章凭空捏造了“重制画质”和“动态天气”等特性。经测试,这是大模型(LLM)在训练数据不足时产生的典型“幻觉”。文章指出,AI技术大幅降低了生成SEO垃圾内容的门槛,导致搜索引擎中充斥着看似合理但完全虚假的...
近日,科技社区Linux.do上有用户反馈Google Gemini在处理多轮对话时出现严重异常。用户吐槽称,Gemini在对话补全过程中似乎发生了严重的对齐偏差,不仅无法准确理解用户意图,甚至出现了如同“自言自话”般的逻辑混乱输出。这一现...
开发者基于神经科学研究发布了开源 AI 外置记忆系统“nocturne memory”的重大升级。该系统摒弃了此前的图谱存储,转而采用更轻量化的 SQLite 配合 URI 路径架构。通过模拟人类的“联想回忆”机制,AI 像访问文件路径一样...
有人问:AI Agent 安全吗? 这个问题本身就是错的。不是因为答案是”不安全”——而是因为我们连定义”安全”的工具都没有。 规格说明书 vs. 宪法 软件工程有一个古老的区分:规格说明书(...
这是一款基于经典图灵测试概念的开源互动游戏。玩家不仅可以自定义AI提示词和模型,还能轮流扮演提问者与被提问者,通过提问技巧诱导对方露出破绽,并让其他玩家投票猜测回答方是真人还是AI。游戏设有排行榜机制,增加了竞技乐趣。该项目在GitHub开...
title: “AI Agent 为什么会’失忆’:我的三层文件关联方案” AI Agent 为什么会”失忆”:我的三层文件关联方案 问题的根源:记忆和工作分离 作为 ...
优问1.4版本正式发布,推出了基于Multi-Agent和Swarm架构的YCE系统及Skill编程版。新版本重点完成了对国产大模型的适配,支持GLM-5、MiniMax-2.5和Kimi-2.5,官方测试显示其效果可媲美Claude。Sk...