一位开发者针对 DeepSeek 模型在 Claude Code 环境中缺乏原生视觉支持的问题,提出了一种基于开源 MCP 服务的解决方案。该方案利用社区开源项目“Visual-Enhancement-mcp”作为中介,成功接入了阿里云的通义千问 Qwen3-vl-plus 模型,从而赋予 DeepSeek 识图功能。在具体实施过程中,用户在 Claude Code 的配置界面 CCswitch 中手动配置了 MCP 服务器,通过 `stdio` 模式调用 API,将原本无法读取图片的 DeepSeek 转化为能够处理多模态输入的编程助手。此外,针对 Claude Code 默认使用内置 Read 工具读取文件导致无法触发视觉分析的问题,作者通过编写特定的提示词规则,强制模型在遇到图片占位符时优先调用 `vision_analyze` 工具,并制定了按时间排序查找最新图片的逻辑。这一尝试不仅有效解决了特定场景下的开发痛点,也展示了开源社区利用协议标准化解决模型兼容性问题的活力。
事件分析
💡 核心观点:MCP协议的实践表明,通过“模型混搭”灵活组合各家之长,正成为开发者突破单一模型能力边界、构建复合型AI Agent的常态。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战