 

格灵深瞳推「丹青」亿级数据集，刷新中文多模态预训练基准

2026-01-19 分类：前沿阅读(2) 评论(0) 赞(0)

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

格灵深瞳正式发布名为「丹青」的大规模中文视觉语言预训练数据集。该数据集包含1亿组精选图文配对，基于2024至2025年网络数据构建，具备高时效性与高质量特性。实验显示，基于该数据集训练的模型在零样本分类、跨模态检索及LMM评测中表现显著优于现有基准，有效缓解了中文多模态领域高质量训练数据匮乏的难题，为行业提供了全新基准。

原文链接：Linux.do

赞(0)

未经允许不得转载：Toy's Tech Notes » 格灵深瞳推「丹青」亿级数据集，刷新中文多模态预训练基准

分享到

AI 多模态数据集格灵深瞳

评论抢沙发

前沿哨所

Claude Opus太贵？开发者实战探讨如何平衡AI模型成本与质量

本文记录了开发者在日常工作中关于AI模型选择的困扰与思考。面对Claude Opus高昂的推理成本，作者提出能否在生成设计文档和待办事项时转用更具性价比的Gemini Pro。社区讨论指出，单纯依赖顶级模型不仅预算难以为继，且性价比不高，建议开发者根据任务复杂度灵活切换模型，以实现开发效率与成本的最佳平衡。

原文链接：Linux.do

3分钟前
Claude Code 2.1.0 揭秘：Agent字段必须配合Fork模式生效

本文针对 Claude Code 2.1.0 进行了技术实测，重点解析了 Skill 配置中 `agent` 字段与 `context: fork` 的协同机制。测试表明，`agent` 字段只有在开启 `context: fork` 时才会生效，强制 Skill 在独立的子代理环境中运行，并仅保留该类型 agent 的固有工具。若未设置 fork 模式，Skill 会在主 agent 上下文中执行并继承全部工具，导致工具限制失效。这一发现为开发者精准控制 AI 工具调用权限提供了重要参考。

原文链接：Linux.do

3分钟前
科研流程原子化：用 Skills 范式让 AI 自动写论文

本文介绍了一种新颖的科研自动化方案，将复杂的学术研究流程拆解为原子化的“Skills”，如检索、大纲、证据构建和写作等。受 Anthropic 设计理念启发，该系统通过编排这些语义单元，让 Claude 或 Codex 像 Agent 一样自动执行任务。项目强调“证据优先”方法论，通过阶段性产物和质量门控制确保输出质量，避免模型产生幻觉。用户只需简单指令，即可在关键节点介入下，让 AI 自动生成高质量的 LaTeX 调查论文。

原文链接：Linux.do

5分钟前
开发神器：用 Opus 4.5 打造的 Base64 可视化 JSON 工具

作者在工作中调用 OCR、TTS 及视觉大模型接口时，深受 Base64 编码与解码繁琐流程的困扰。为此，他利用 Opus 4.5 模型开发了一款名为 ViewJSON 的在线工具。该工具可直接解析 JSON 中的 Base64 字符串，将其自动转换为图片、音频、视频或 PDF 进行预览。工具支持图片直接转 Base64、变量管理、本地历史记录存储及 JSON 格式化等功能，完全免费且无需登录，能有效提升开发者的 API 测试效率。

原文链接：V2EX 分享发现

1小时前
AVX-512深度实战：为何显式SIMD比CUDA更契合LLM时代？

本文深入探讨了AVX-512的性能与可编程性，通过K-Means算法对比了手动向量化、编译器自动优化及CUDA的差异。实测显示，手动AVX-512代码虽繁琐，但实现了接近理论极限的性能，大幅领先自动向量化。文章指出，相比CUDA的抽象，显式SIMD在性能上更具可控性。作者进一步提出，随着免费午餐的结束和LLM的兴起，显式低级编程将回归，利用AI生成底层代码将成为高效开发的新范式。

原文链接：Hacker News

1小时前
不要浪费AI Agent的“反馈压力”

文章探讨了“反向压力”概念在AI Agent开发中的重要性。作者指出，最成功的Agent应用通过构建自动化反馈机制，使Agent能够自我识别并纠正错误，从而胜任更长期的任务。相比人工逐行检查代码，为Agent配备构建系统、强类型语言或测试工具作为反馈源，能极大释放工程师的精力。未来工程的核心将在于设计和构建这种反馈机制，以提高AI贡献的可信度与规模。

原文链接：Hacker News

1小时前