Volcano Ark Temporarily Takes Down Doubao 1.8 Model for GUI Optimization
Volcano Ark temporarily takes down Doubao 1.8 model for GUI optimization, with service resuming after improvements.
Volcano Ark temporarily takes down Doubao 1.8 model for GUI optimization, with service resuming after improvements.
一篇来自 V2EX 的技术分析文章指出,业界常用的“缓存命中率”作为衡量 LLM Provider 性能的指标存在严重缺陷。由于命中率是一个百分比,其分母受用户输入长度、子 Agent 调用次数等使用习惯影响巨大,导致该指标混淆了“用户行为”与“Provider 缓存质量”,无法真实反映性能优劣。文章提出应以“绝对未命中数”作为核心指标,即计算“上一条总 Token 数”与“当前从缓存读取 Token 数”的差值,该数值直接量化了被重复处理而浪费的 Token。作者基于 16 万条消息的实证分析显示,不同模型在输出侧 KV 复用能力上差异显著:DeepSeek-v4 能在 85% 的对话中复用上一轮输出,GLM-4.7 为 63%,而 GPT-5.5 仅为 0.3%。这表明 vLLM 和 SGLang 等框架支持的输出侧 KV 复用对控制成本至关重要,未支持该能力的模型会导致严重的资金浪费。为帮助开发者监控,作者发布了一款开源可视化工具,可直接读取本地 OpenCode 的 SQLite 数据库,展示每日缓存未命中情况并下钻至具体会话细节。
💡 核心观点:告别虚荣指标:从“相对比率”转向“绝对浪费”度量,是 LLM 落地降本的关键一步。
原文链接:V2EX 分享发现
本教程详细阐述了如何利用DeepSeek大模型与豆包平台相结合,从零构建具备实用价值的通用AI智能体。课程内容系统覆盖了智能体的核心设计原理、对话交互流程的搭建逻辑、私有化知识库的配置方法以及多场景实战演练。通过从理论到实践的完整教学路径,旨在指导学习者掌握利用大模型进行自动化应用开发的关键技巧。该内容特别适合教育工作者及技术开发者,通过项目实战,不仅能快速上手智能体创作,还能深入理解如何利用人工智能提升效率。教程重点突出了实操性,展示了AI在个性化辅导、智能问答等领域的应用潜力,并附带了网盘资源以便随时获取相关资料,为希望进入AI开发领域的初学者提供了低门槛的解决方案。
💡 核心观点:DeepSeek与豆包的组合降低了Agent开发门槛,标志着国产大模型正加速从参数竞赛转向生态化与场景落地的应用新阶段。
原文链接:Linux.do
近期,Anthropic 推出的 AI 原生编程工具 Claude Code 在开发者社区引发了广泛关注,其独特的交互方式和复杂的系统架构成为讨论焦点。在 Linux.do 论坛上,有开发者发帖表示,初次接触 Claude Code 时被其庞大的功能体系所困扰,认为这不仅仅是一个简单的代码生成器,而是一个高度复杂的系统。该求助帖特别提到了社区中涌现的知名插件,如 openspec 和 superpowers,表明围绕 Claude Code 的第三方生态已经开始活跃。然而,即便是资深开发者,对于如何有效利用这些插件以及理解其背后的工作原理仍存在认知盲区,完全没有使用的概念。这一现象反映了当前 AI 编程工具正经历从单一功能的 Chatbot 向具备高度自主性和可扩展性的 AI Agent 演进,同时也暴露出新一代 AI 开发工具在易用性与功能性之间的平衡挑战,社区急需高质量的使用指南来降低迁移成本。
💡 核心观点:Claude Code 的上手难度折射出 AI 编程正从辅助工具向复杂智能体进化的阵痛,插件生态的爆发预示着新型开发范式的到来。
原文链接:Linux.do
阿里巴巴千问团队正式发布了旗下独立的 AI 输入法应用——千问输入法 macOS 版,目前已在官网上线。该产品主打“极速语音输入”能力,借助 AI 技术将语音输入速度提升至最快每分钟 300 字。与传统的语音转文字不同,千问输入法深度融合了大模型技术,具备口语润色与文本整理能力,能够自动去除语气词、纠正错别字并格式化文本,将用户的语音内容直接转化为工整的书面语。此外,该应用支持包括粤语、四川话等在内的 9 种方言识别,并明确承诺“纯净无广告”,以此区分于市面常见的商业化输入法。回顾发展历程,千问团队早在今年 5 月便在千问 App 内部试水了该语音输入组件,而此次作为独立 App 上线,标志着阿里正式入场 AI 输入法赛道。官方还透露,覆盖 iOS、Android 和 Windows 平台的版本已完成开发,将于近日发布,意在实现全平台的 AI 输入体验覆盖。
💡 核心观点:阿里用大模型重构输入法,意在将其打造为 AI Agent 的核心交互触点,从“输入工具”进化为“内容处理入口”。
原文链接:Linux.do
近日,开发者社区Linux.do的一则讨论引发了关于AI模型搜索能力的关注。一位开发者在测试中发现,谷歌旗下的Gemini模型在回答关于特定命令行工具`agy-cli`的问题时,存在严重的“幻觉”现象。该模型未有效联网检索信息,而是自信地输出了错误的配置参数,导致用户被误导。与之形成鲜明对比的是,竞争对手Anthropic的Claude在面对不确定性问题时,表现出了更谨慎的检索机制,通过利用搜索能力来弥补知识盲区,从而提供更准确的回答。这一案例不仅暴露了Gemini在实时信息获取和事实核验方面的短板,也引发了业界对于“搜索巨头谷歌为何没能做好AI搜索”的广泛讨论。对于开发者而言,AI模型的准确性与可靠性直接影响工作效率,Gemini此次的表现令人失望,也凸显了RAG(检索增强生成)技术在AI应用中的关键作用。
💡 核心观点:搜索起家的谷歌其AI却在“懂搜索”上落后,这不仅是技术短板,更是传统搜索向生成式AI转型阵痛的缩影。
原文链接:Linux.do
本次发布的内容详细记录了对 IBM MCGA(Multi-Color Graphics Array)图形适配器核心芯片组的逆向工程全过程。MCGA 曾是 PS/2 Model 25 和 30 的标志性视频子系统,其核心由两块门阵列芯片组成:内存控制器(72X8300)和视频格式化器(72X8205)。研究者对基于精工 SLA6430 和 SLA6330 的芯片版本进行了物理开盖与高精度成像,成功提取了金属层的互连信息。通过将显微图像导入 KiCad 并手动绘制网表,项目还原了包含数千个基本单元的 2 微米 CMOS 电路逻辑。除了还原电路原理图,该研究更揭示了官方技术手册中未记载的功能细节。研究发现,该芯片组具备 Genlock(同步锁相)能力,允许外部视频源同步;同时挖掘出了一系列未公开的制造测试寄存器,这些寄存器能够控制计数器加速、时钟切换及硬件复位。这些成果不仅填补了历史文档的空白,也为在 FPGA 等现代平台上复刻该逻辑提供了详实的物理依据。
💡 核心观点:逆向工程不仅是考古,更是透过物理电路还原设计意图的硬核技术,为现代芯片安全与遗留系统维护提供了教科书级的方法论。
原文链接:Hacker News
Claude Code 用量怎么算: Pro、Max 5x、Max 20x 与 ReClaude2026-06-27
Claude Code Pro/Max 支付指南: 信用卡、Apple ID 与 Google Play2026-06-27
Claude Code 封号原因复盘: IP、支付、KYC 哪个最危险2026-06-27
Claude Code Pro/Max 还值得订阅吗: 27天5次封号复盘2026-06-27
Claude Desktop 中文使用指南: 安装、中文交互与 MCP 配置2026-06-26
Agent Skill 跨工具复用: 目录结构、版本管理与团队共享2026-06-26