一位资深用户分享了从OpenClaw迁移至Hermes的心得体验。尽管使用了三个月,但OpenClaw在记忆机制上的短板(无法跨窗口记忆、依赖文档全量加载导致Token成本过高)令人失望。反观Hermes,在底层模型(如GLM系列)相同的情况下,展现了更强的自主性:它能主动将视频转录这一复杂任务封装为可复用的“技能”,无需人工编写Prompt。这一案例生动地演示了AI Agent从“被动记忆”向“主动工具化”演进的技术趋势。
原文链接:Linux.do
一位资深用户分享了从OpenClaw迁移至Hermes的心得体验。尽管使用了三个月,但OpenClaw在记忆机制上的短板(无法跨窗口记忆、依赖文档全量加载导致Token成本过高)令人失望。反观Hermes,在底层模型(如GLM系列)相同的情况下,展现了更强的自主性:它能主动将视频转录这一复杂任务封装为可复用的“技能”,无需人工编写Prompt。这一案例生动地演示了AI Agent从“被动记忆”向“主动工具化”演进的技术趋势。
原文链接:Linux.do
Moonshot AI 正式发布并开源了新一代编程模型 Kimi K2.7 Code。通过内外部基准评估验证,新模型在长上下文编程场景的指令遵循及长程任务性能上,相比 K2.6 模型实现了显著提升。具体数据方面,K2.7 Code 在 Kimi Code Bench v2 中性能提升 21.8%,Program-Bench 提升 11%,而在 MLS Bench Lite 上更是提升了 31.5%。
该模型优化了长程任务中的“过度思考”倾向,使平均 Token 消耗减少 30%,这一改进直接提升了模型的 Agentic 能力,在 Kimi Claw 24/7 Bench、MCP Atlas 等智能体基准测试中性能增长约 10%。目前,该模型已在 Kimi API 开放平台及 Kimi Code Plan 上线,1M Token 标准输入输出价格维持 6.5 元和 27 元,但强制要求开启“思考模式”。此外,官方预告将于 6 月 15 日推出输出速度达 260 Token/s 的 6 倍速版本,定价为普通版的 2 倍。非编程任务仍推荐使用 K2.6 模型。
产业影响方面,该模型在 Agentic 能力上的增强(如对 MCP 协议的支持)显示出 AI 编程工具正从简单的代码补全向具备自主规划能力的“AI 智能体”演进。强制开启思考模式的要求,也暗示了复杂逻辑推理对于提升代码质量的关键作用。
此外,“6 倍速”版本的推出以及“2 倍价格”的策略,反映了市场对实时交互体验的迫切需求,厂商正通过分层定价策略,为对延迟极度敏感的开发者提供差异化服务。
💡 核心观点:K2.7 Code 通过优化推理成本与提升 Agent 执行力,加速了 AI 编程助手从“辅助工具”向“自主开发体”的实质性跨越。
原文链接:Linux.do
月之暗面正式发布了基于 Kimi K2.6 构建的编程专用智能体模型——Kimi K2.7 Code,并在 Hugging Face 平台完成开源。该模型主要针对真实世界中的长周期编程任务进行了深度优化,旨在加强复杂软件工程工作流中的端到端任务处理能力。与前代相比,K2.7 Code 在多个核心编程基准测试中展现出显著优势:在 Kimi Code Bench v2 上提升了 21.8%,在 Program Bench 上提升了 11.0%,在 MLS Bench Lite 上更是实现了 31.5% 的性能飞跃。除了准确率的提升,该模型还极大地优化了推理效率,思维链 Token 的使用量较 K2.6 减少了约 30%,这意味着开发者可以以更低的成本获得更高质量的代码生成服务。此外,模型改进了指令遵循能力,直接提升了端到端编程任务的成功率。目前,该模型已通过 Kimi API 开放平台和 Kimi Code 提供服务,助力开发者构建下一代 AI 应用。
💡 核心观点:降本增效成 AI 编程新赛点,K2.7 Code 以推理成本降低 30% 重塑编程智能体竞争格局。
原文链接:Linux.do
近期,关于 OpenAI Codex 应用及相关 AI Agent 工具在 Windows 环境下的终端兼容性问题引发了开发者的广泛关注。多位用户在技术社区反馈,在 Windows 11 环境下,尽管尝试配置默认使用 Git Bash,该应用仍强制通过内部终端调用 PowerShell。这一问题导致即使 Agent 试图执行 Bash 命令,也会被包裹在 PowerShell 环境中运行,具体表现为通过 PowerShell 代理调用 `bash.exe` 及其后续命令。这种多层级的调用不仅造成命令执行性能显著下降,还因多余的上下文转换和解释过程而浪费大量 Token,降低了 AI 编程的实际效率。社区讨论显示,目前仅有的变通方案是显式调用完整路径的 bash 可执行文件,但这一操作繁琐且不具备通用性。追踪 OpenAI Codex 的 GitHub Issue #16717 可知,底层工具 `functions.shell_command` 默认仅配置为 PowerShell 是造成这一限制的根本技术原因。此外,部分尝试迁移至 WSL 环境的用户表示,虽然 WSL 能提供更原生的 Linux 体验,但在 Codex App 中存在严重的卡顿问题,导致系统整体响应变慢。且跨环境迁移项目文件、配置 Node 环境、SSH 及代理的成本极高,体验并不理想。这反映了当前 AI Agent 工具在跨平台底层适配上仍存在显著的技术瓶颈。
💡 核心观点:AI Agent 的工程化落地,不仅取决于模型智商,更在于能否打通跨平台环境适配与底层指令调用的“最后一公里”。
原文链接:Linux.do
百度飞桨 PaddleOCR 团队正式发布了 PP-OCRv6 版本,标志着这一轻量级 OCR 工具在准确率和推理效率上取得了双重突破。新版模型系列包含微型、小型和中型三种规格,参数量跨度从 150 万至 3450 万,以适应不同边缘环境的需求。实测数据显示,与 PP-OCRv5 相比,v6 版本的检测准确率提升了 4.9%,识别准确率提升了 5.1%。尤为引人注目的是其硬件适配性,通过 OpenVINO 优化,CPU 推理速度最高可提升 5.2 倍。PP-OCRv6 还在统一模型中实现了 50 种语言的支持,并针对性新增了 PCB、CAD 图纸、数码管及点阵文本等垂直场景识别能力。项目采用 Apache 2.0 协议开源,代码托管于 GitHub,定位为将图像和 PDF 转化为结构化数据的“轻量级 OCR 工具”,致力于打通视觉信息与大模型之间的数据壁垒。
💡 核心观点:PaddleOCR v6 通过极致的轻量化与 CPU 推理优化,正在成为大模型时代连接物理世界与数字语义的关键基础设施。
原文链接:Linux.do
开发者hellowind777在代码托管平台GitHub发布了迭代近一年的开源项目HelloAGENTS,旨在构建一个能够自主分析问题并持续工作直至实现的智能体系统。该项目已从最初的单一规则文件演进为当前的双模式形态,核心亮点在于它不仅仅是一个简单的自动化工作流,而是一个具备自我修正和深度管理能力的“高级智能伙伴”。在技术实现上,HelloAGENTS针对大模型在实际应用中的痛点进行了针对性优化。项目引入了独特的“纠正GPT黑话”机制,实质上是对模型输出进行专业化的后处理或约束,以确保生成内容符合行业规范。此外,系统强调全自动维护知识库的能力,通过任务分层与质量约束技术,解决了传统RAG(检索增强生成)系统中数据更新滞后和检索质量不稳定的问题。该项目集成了12个基础命令和14项核心技能,能够处理复杂的逻辑推理与任务调度。值得注意的是,作者还展示了项目在Claude Code生态中的扩展能力,包括hello2cc插件以及支持DeepSeek进行图像识别的多模态技能hello-multimodal。这显示该项目致力于打通不同大模型平台与开发环境的壁垒,实现模型能力的聚合与原生体验的无缝对接。
💡 核心观点:HelloAGENTS通过知识库自动维护与任务纠错机制,验证了AI智能体从被动指令执行向具备自主管理与质量内控能力的演进方向。
原文链接:Linux.do
近期,开发者社区 Linux.do 上发起了一场关于国产大模型代码生成能力的深入讨论,核心议题聚焦于 DeepSeek 与 Qwen(通义千问)这两款代表性模型,是否具备超越或比肩 Anthropic 旗下 Claude Code 以及 OpenAI Codex 技术的实力。随着开源模型技术的飞速迭代,越来越多的实测反馈显示,国产模型在代码逻辑推理、长上下文处理以及多语言支持上取得了显著进步。DeepSeek 凭借其强大的数学推理底座,在处理复杂算法和架构设计时表现出色;而 Qwen 则在多语言代码生成的准确率上稳步提升。尽管目前在实际工程落地中,Claude Code 仍因其极高的精细度和极低的幻觉率被许多开发者视为“标杆”,但国产开源模型凭借灵活的部署能力和极高的性价比,正在迅速缩小差距。这场讨论不仅是单一产品的对比,更折射出全球 AI 编程助手市场正从闭源垄断向开源多元竞争格局演变的趋势,开发者对于“第二选择”甚至“首选”的考量标准正在发生根本性变化。
💡 核心观点:开源大模型在编程领域的快速突围,标志着AI开发工具正从封闭走向平权,性价比与数据安全将成为重构市场的关键变量。
原文链接:Linux.do




