实测五款国产大模型:字节豆包在空间理解与轨迹规划中意外夺冠
本文基于物理轨迹生成的科研需求,通过400次蒙特卡洛仿真实验,对DeepSeek-V3、Qwen2.5、GLM-4.5、字节豆包及MiniMax五款主流国产大模型的空间理解能力进行了严格测评。测试涵盖了2D及3D环境下的多障碍物规避与轨迹连...
本文基于物理轨迹生成的科研需求,通过400次蒙特卡洛仿真实验,对DeepSeek-V3、Qwen2.5、GLM-4.5、字节豆包及MiniMax五款主流国产大模型的空间理解能力进行了严格测评。测试涵盖了2D及3D环境下的多障碍物规避与轨迹连...
V2EX 社区分享了开源项目 ‘delier-helper’,该工具集成了 DeepSeek 和 Google 等 AI 模型,旨在解决开发者撰写各类技术文档的痛点。其功能覆盖了软件著作权申请所需的代码生成、接口文档...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
开发者推出了一款名为 Nowen Note 的开源自托管知识库应用,旨在成为群晖 Note Station 的开源替代方案。该项目采用前后端分离架构,支持 Docker 一键部署,确保用户数据完全私有化。核心功能方面,Nowen Note ...

你可能经常看到”大模型””蒸馏””MoE”这些词。它们到底是什么?为什么 DeepSeek 能用六分之一的成本干翻硅谷?为什么 Anthropic 说中国公司在R...
本资源汇集了一套完整的AI实战视频教程,包含19个文件,涵盖了当前最热门的AI应用场景。内容从视频生成(可灵、Sora)到日常办公(WPS AI、Napkin),再到教育辅助(豆包、老师帮)及创意设计(DeepSeek文案、创客贴海报)。教...
该资源库汇集了当前最前沿的开源大语言模型架构图与详细参数表,由 AI 专家 Sebastian Raschka 整理发布。内容不仅涵盖了 Meta Llama 3、DeepSeek V3/R1、Mistral 等国际主流模型,还重点收录了包...
面对云端 API 成本高企及数据隐私痛点,作者分享了将 AI 任务迁移至本地的实战经验。通过购入极摩客 EVO-X2(128G 内存)工作站,并配合 Ollama 与 Open WebUI 软件栈,成功部署了满血版 DeepSeek 模型。...
本文详细介绍了利用 GMKTEC EVO-X2 (128GB RAM) 进行 DeepSeek 大模型本地部署的完整流程。通过整合 Ollama 与 Open WebUI,该方案实现了无需联网的本地推理,彻底解决了数据隐私与长期 API 成...
随着DeepSeek-OCR模型的热度上升,社区正在积极挖掘其云端应用潜力。尽管GitHub上的`DeepSeek-OCR-WebUI`等项目提供了现代化的界面和强大的批量处理功能,但用户更倾向于将其与硅基流动等云端API对接。这一需求反映...
在AI模型聚合平台OpenRouter上,社区发现了一个名为“hunter-alpha”的神秘模型,其规格标注为惊人的1T(万亿)参数量及1M(100万)上下文窗口。目前该模型支持完全免费调用。鉴于DeepSeek近期在技术上的突破性表现及...