近日,科技社区Linux.do发布了一项针对大模型3D代码生成能力的对比实测,测试对象为疑似字节跳动豆包的新模型以及xAI的Grok模型。测试场景主要围绕“引力坍缩/黑洞”与“深海幻梦/水母”两个复杂的3D HTML渲染任务展开。
在首轮“黑洞”场景测试中,豆包模型生成的代码在视觉亮度控制上存在缺陷,画面全程过亮,但直接输出了可用的HTML文件。相比之下,Grok生成的画面像素风格过重、清晰度低,且视角交互功能失效,甚至会出现自动复位的问题。然而,由于Grok能将代码自动写入工作区并支持预览,极大地减少了开发者的手动操作成本,评测者判定Grok在此环节凭借更好的开发体验获胜。
在第二轮“水母”场景测试中,豆包模型展现出了对细节更强的把控力,特别是在水母尾部的建模上还原度较高,但也出现了对移动端适配过度导致PC端交互受限的问题。Grok生成的效果则显得较为粗糙,其生成的快速摆动触手甚至被评测者形容为“恐怖片”效果。综合来看,豆包在视觉细节和代码质量上表现更优,印证了其在图形渲染方面的潜力。
事件分析
产业视角下,这种“Code Arena”式的比拼正成为衡量AI Agent实际落地能力的标准。未来的AI编程竞争将不再仅限于代码生成的准确率,而是扩展到对复杂视觉语义的理解、多端兼容性以及开发者工作流的深度集成。字节跳动与xAI在3D生成领域的这种角力,预示着前端开发工作流即将迎来自动化的变革。
💡 核心观点:大模型代码生成的竞争焦点已从基础逻辑正确性转向视觉渲染精度与IDE交互体验的深度融合。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪