 

Z.ai发布GLM-4.6V模型，9B版本评测超越Qwen2-VL-8B，API百万token免费调用

2025-12-09 分类：前沿阅读(60) 评论(0) 赞(0)

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

Z.ai近日发布了新一代视觉语言模型GLM-4.6V，其中9B规模的Flash版本在通用视觉问答基准测试(MMBench)中取得了86.9分，超越了Qwen2-VL-8B模型的84.3分。该模型现已开放API免费调用，用户可在百万token额度内免费体验。GLM-4.6V的技术特点包括支持处理长达150页的文档和一小时内的视频内容，并具备视频时间轴分析功能。开发者可通过chat.z.ai平台与这款由GLM-4.6和GLM-4.5驱动的AI助手交互，用于构建应用、创建演示文稿和专业写作。

原文链接：Linux.do

赞(0)

未经允许不得转载：Toy's Tech Notes » Z.ai发布GLM-4.6V模型，9B版本评测超越Qwen2-VL-8B，API百万token免费调用

分享到

评论抢沙发

前沿哨所

解决AI编程上下文难题：llmdoc方案提升Agent效率

面对AI Coding全面铺开的趋势，上下文构建成为严肃生产环境中的核心难题。本文提出了“Context Floor”概念，并介绍了一套名为llmdoc的解决方案。该方案通过构建兼顾人类和AI可读的高密度文档系统，结合Subagent RAG技术，实现了在不增加主Agent Token占用的前提下，快速提供强关联的有效信息。实测表明，该方案在十万行代码库中表现优异，大幅降低了人工介入成本，有效提升了复杂项目中AI Agent的开发效率。

原文链接：Linux.do

53分钟前
Claude Code 进阶指南：精通配置、插件与高效开发流

本文详细解析了 Claude Code 的底层配置与实战技巧。文章首先剖析了 ~/.claude 目录结构，厘清了核心配置、扩展系统及运行时数据的作用。其次对比了 Commands 与 Skills 的差异，并展示了插件系统的使用方法。此外，作者分享了 MCP 最佳实践及多配置启动器搭建，提倡通过“滚雪球式”优化将 AI 交互经验沉淀为长期能力，帮助开发者打造专属的高效编码工作流。

原文链接：Linux.do

53分钟前
开源 CCW 6.3.48：实现一键式全自动 AI 软件开发工作流

Claude Code Workflow (CCW) 是一个基于 JSON 驱动的多智能体开发框架，致力于将 AI 开发从简单的提示词链接提升至强大的系统化编排。该框架支持 Gemini、Qwen 等多种大模型，通过智能 CLI 实现上下文优先架构和自动化工作流执行。CCW 提供了自动编排器用于快速通用任务，以及智能协调器用于处理复杂、可恢复的多步骤流程。用户只需简单的自然语言指令，即可实现从意图分析到代码执行的全流程自动化，极大提升开发效率。

原文链接：Linux.do

53分钟前
提升代码准确率：llmdoc 解决 AI 编码“最后一百米”

本文探讨了 AI 编码工具在生产环境中的上下文构建痛点。作者提出了“Context Floor”概念，并推出了结合“llmdoc”高密度文档系统与“SubAgent RAG”的解决方案。经企业 10 万行代码项目验证，该方案显著提升了 AI 上下文获取效率与代码准确性，大幅降低人工介入频率。尽管成本略有增加，但在复杂项目中收益显著，为生产级 AI 编码提供了新思路。

原文链接：V2EX 分享发现

2小时前
SSL证书有效期将缩至45天，自动化运维成生存刚需

Sectigo 与 Let's Encrypt 等主流机构确认将大幅缩短 SSL 证书有效期。Sectigo 计划从 2026 年 3 月起缩短至 199 天，Let's Encrypt 更激进地将在 2028 年缩短至 45 天。此举旨在限制安全漏洞影响范围并提升吊销效率。然而，频繁的续期要求将使手动管理变为噩梦，这标志着运维必须全面拥抱自动化，传统的证书管理模式面临淘汰。

原文链接：V2EX 分享发现

2小时前
1960年代的实时计算奇迹：IBM 9020 如何接管美国领空

本文详细回顾了美国空中交通管制系统从SAGE向IBM 9020转型的历史。9020基于System/360架构，首创多机“多系统”并联设计，通过复杂的共享内存和故障自动分析程序（OEAP）实现了极高的实时性与可靠性。这一系统不仅是当时技术的巅峰，更为现代分布式计算和高可用性架构奠定了基础。

原文链接：Hacker News

2小时前