近日,一位开发者在 V2EX 上发布了名为 Office Open 的纯 TypeScript 库,该库专注于 DOCX、PPTX 和 XLSX 格式的生成、解析及模板填充。作者最初开发此库是为了将 DOCX 存储解析为 JSON 格式,以便进行在线编辑和集成 AI 工具。项目经历了从完善原版 docx 包、支持更多 WML/PML/SML 元素,到逐步剔除 Class 并完全转向 JSON 模式的演进。通过将 XML 生成和解析部分重写,并将打包工具从 jszip 替换为 fflate,该库在性能上实现了显著突破。Benchmark 测试数据显示,在处理约 100MB 的混合内容 DOCX 文件(包含段落、图片和表格)时,Office Open 的同步处理性能达到每秒 9.7 次操作,而原版 docx 库仅为 0.3 次;在处理大型 XLSX 文件(10万行x20列)时,其性能也优于同类竞品 hucre。目前,该库已支持通过 JSON 直接生成完整文档,并提供在线体验网站。作者正就类型定义的校验方案(如转化为 Zod 或 JSON Schema)以及未来在线编辑渲染方案(如基于 Leafer.js)寻求社区建议。
事件分析
💡 核心观点:纯 JSON 架构的 Office 处理库填补了大模型与结构化文档生成之间的鸿沟,有望成为 AI 原生办公工具的基础设施。
原文链接:V2EX 分享发现







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航