 

共 58 篇文章

标签：豆包

Kilo Code现匿名模型“giga-potato”，疑似字节跳动新版豆包

AI编程基准Kilo Code近日惊现一名为“giga-potato”的匿名国产模型。根据社区讨论和技术线索推测，该模型极有可能是字节跳动即将推出的新版“豆包code”模型。尽管官方尚未官宣，但这一动态已在科技圈引发广泛关注。作为国产大模型...

Toy2026-01-17前沿阅读(46)去评论

豆包安卓版更新：引入沉浸式全语音模式与爱学功能

豆包安卓版迎来11.9.1更新，重点整合了“豆包爱学”功能，并引入全新的完全语音模式。在该模式下，AI不再直接显示完整文本回复，而是通过语音进行沉浸式交互。用户可根据需求在右上角调整语速或关闭字幕，进一步优化了语音对话与学习体验，标志着AI...

Toy2026-01-15前沿阅读(45)去评论

AI语音交互技术探讨：解析豆包与钉钉背后的实现原理

本文深入探讨了实现AI语音回复的三种技术路径：传统的STT-LLM-TTS级联模式、直接调用语音模型的端到端模式，以及基于流式的实时转化模式。文章还分析了钉钉AI的播报功能及豆包语音交互的技术原理，讨论了RAG在语音模型中的应用可能性，反映...

Toy2026-01-15前沿阅读(36)去评论

AI摄影新玩法：实测用豆包指导拍照姿势，效果惊艳

一位 V2EX 用户分享了使用字节跳动豆包 AI 的体验。因苦于拍照技术不佳且曾寻找技术方案无果，该用户受社交平台启发，尝试用豆包指导拍照姿势。实测发现，AI 的指导不仅操作简单，效果也远胜盲拍。这一案例生动展示了生成式 AI 正突破纯文本...

Toy2026-01-13前沿阅读(44)去评论

跨屏输入新方案：LazyTyper接入豆包语音，提升编程效率

针对开发者在“Vibe Coding”场景下打字效率低下的痛点，作者尝试了多种语音输入方案。在排除了准确率欠佳的离线工具和存在Bug的竞品后，最终利用LazyTyper成功接入了准确率极高的豆包云端语音模型。该方案不仅解决了跨屏输入的难题，...

Toy2026-01-09前沿阅读(39)去评论

AI客户端评测：豆包、Monica等工具优缺点分析

本文对豆包、Comet浏览器、Monica和cherry studio四大AI客户端工具进行深度评测。豆包优势包括套壳Chrome内核支持网页浏览、AI阅读模式快速总结内容，以及响应迅速，但模型质量一般且易长篇大论；Comet浏览器提供网页...

Toy2026-01-06前沿阅读(114)去评论

免费工具：一键批量去除豆包水印

针对豆包水印烦人问题，开发者推出免费无广告小程序“可可熊去水印”。支持电脑和手机使用，操作简单：选中豆包页面所有图片消息，复制分享链接粘贴即可批量保存无水印图片。工具解决了用户痛点，提供便捷解决方案，无需付费，兼容性良好。原文链接：V2E...

Toy2026-01-05前沿阅读(65)去评论

随机模型聊天：快乐体验与生产力的挑战

用户在Linux.do论坛分享，体验了一个web端聊天机器人，最初以为是GPT，但刷新后发现是随机模型，Claude与豆包等混杂。这带来了意想不到的聊天乐趣，用户陷入随机聊天的快乐中。同时，用户回忆起公益站也有类似随机模型。文章提醒，虽然有...

Toy2026-01-05前沿阅读(38)去评论

AI走进寻常家：父母学习豆包的启示

元旦假期，作者回家发现普通工薪家庭的父母也在使用豆包AI应用。尽管对互联网不熟悉，他们开始利用豆包完成日常任务如查询菜谱、生成动态图片。豆包作为多模态AI工具，日活用户已过亿，显示AI技术快速渗透普通人生活。作者反思，好的AI不在于复杂功能...

Toy2026-01-02前沿阅读(35)去评论

Navi插件：AI对话快速跳转神器

Navi是一款Chrome插件，专为解决AI长对话中的痛点设计。用户在ChatGPT、Gemini等平台进行深度交流时，常因对话冗长而难以快速定位问题。Navi通过目录管理功能，实现一键跳转，显著提升效率。支持主流AI工具，包括ChatGP...

Toy2026-01-02前沿阅读(47)去评论

国产AI大模型体验：豆包手机功能解析

国产AI大模型展现强劲实力，豆包手机作为系统层级大模型实现自动化任务执行，信息检索全面可对接主流信息源。作者基于个人体验，虽未购买但参考测评，认为其可靠性强；同时提及华为Mate40用户对类似功能的期待，并简要介绍文心一言、360智脑等模型...

Toy2026-01-02前沿阅读(54)去评论

豆包1.6中文表现优异，但API耗尽引用户寻替代方案

用户在Linux.do论坛分享，测试了豆包1.6在知识理解和题目解答中的表现，发现其中文理解能力优于Gemini和o3模型。然而，豆包客户端存在对话上下文不连续的问题，且免费API额度已耗尽，引发用户寻找经济实惠的替代方案。该话题吸引了42...

Toy2025-12-31前沿阅读(33)去评论

美团龙猫画图模型被指模仿豆包风格

美团龙猫的画图模型近日被用户发现其画风与豆包/即梦系列模型高度相似。用户通过对比测试发现，美团龙猫的画图模型在视觉风格上与豆包4.0、4.1、4.5版本非常接近，但画质相对粗糙。这一观察引发了关于AI绘画模型之间可能存在技术借鉴或风格趋同的...

Toy2025-12-30前沿阅读(33)去评论

复刻豆包语音：AI引擎选择指南

文章探讨如何复刻豆包语音功能、打电话体验及语音纠错，聚焦字节跳动AI引擎的产品选择。内容深入分析技术实现路径，包括语音识别、合成和纠错算法的应用，为开发者提供实操建议。文章揭示AI语音技术在实际落地中的挑战，如性能优化和成本控制，同时反映行...

Toy2025-12-30前沿阅读(31)去评论

手机输入脚本破解Windows语音输入难题

针对Windows平台语音输入法不足的问题，一位开发者创建了便捷脚本，通过手机网页实现语音输入，显著提升Vibe Coding效率。用户指出，现有工具如Whisper、闪电说和智谱效果欠佳，而豆包输入法虽优秀但需依赖耳机。该脚本利用AI技术...

Toy2025-12-30前沿阅读(26)去评论

豆包Seedance 1.5 Pro开源：AI视频生成工具支持文生图生视频

豆包Seedance 1.5 Pro是一款基于豆包AI的创新视频生成工具，支持从文本和图像生成高质量视频。用户可通过Gradio Web UI进行交互操作，或使用RESTful API进行程序化调用，部署过程简单，支持Docker一键安装。...

Toy2025-12-29前沿阅读(28)去评论

AI工具实战吐槽：ChatGPT碾压对手，Gemini翻车

用户深度体验多个AI工具：ChatGPT在工具调用、思考过程和debug能力上表现优异，但存在调用次数限制；Gemini和Grok虽不拒绝但理解力差，常给出幻觉方案；GLM语义理解好且不拒绝；Sora网页版内存泄露严重；豆包广告泛滥。文章揭...

Toy2025-12-29前沿阅读(34)去评论

国内AI Agent哪家强？幻觉问题引热议

近日，用户在Linux.do论坛发帖询问国内好用AI Agent功能，特别提到Kimi的okcomputer和豆包的超能模式存在幻觉问题，希望找到更可靠的替代品。讨论反映了当前AI Agent技术在实际应用中的挑战，如幻觉现象，引发行业对可...

Toy2025-12-28前沿阅读(44)去评论

2026年AI展望：从Agent到操作系统的飞跃

2025年被称为AI Agent元年，Claude code等产品改变了生活，MCP、skill、subagent等技术兴起。2026年有望成为AI操作系统之年，豆包手机等AI操作电脑项目开始出现。文章表达了对明年AI发展的期待，涵盖了从A...

Toy2025-12-27前沿阅读(70)去评论

豆包AI登录后反而'变笨'？技术社区发现反常现象

近日，技术社区V2EX上一则关于豆包AI的发现引发关注。有用户测试发现，在不登录状态下，豆包AI能够完整解析GitHub代码提交链接并生成详细总结；而登录后，同一请求却得到’未查询到相关信息’的回复。这一反常现象揭示...

Toy2025-12-26前沿阅读(56)去评论

1
2
3
下一页
共 3 页

前沿哨所

DeepSeek悄然解锁多模态能力，实测已支持图像识别

DeepSeek在近期更新中悄然上线了多模态能力。经用户测试，DeepSeek App及网站现已能够识别并理解图片内容，如准确辨认物体等。这一更新标志着DeepSeek从纯文本模型向图文结合的多模态AI迈进，补齐了其在视觉感知方面的短板，使其在通用大模型领域的竞争力进一步提升。

原文链接：Linux.do

1小时前
用户吐槽微软 Copilot 智商下降：GPT5.2 竟仅能对标豆包？

一位用户反馈，此前使用“大兵”版本的 GPT5.2 时体验极佳，但切换至微软 Copilot 后，感觉模型智商明显下降，回答问题难以切中要害。对比发现，官网版本尚能与 Gemini 3 Pro 抗衡，而 Copilot 版本的表现却仿佛降级至豆包水平。该贴引发了关于不同平台间同一模型性能差异及是否存在“降智”处理的讨论。

原文链接：Linux.do

1小时前
TikTok新政：收集精准定位与AI交互数据，广告网全面扩张

随着TikTok正式转为美资多数控股，其新隐私政策开始生效。用户需同意新条款才能继续使用，其中包含三项重大变更。首先是开启精准位置追踪，收集GPS数据；其次新增对AI交互的监控，包括用户输入的提示词和AI生成内容；最后扩大广告网络，利用合作出版商的数据在全网投放精准广告。这意味着TikTok在合规的同时，大幅提升了对用户数据的挖掘深度。

原文链接：Hacker News

2小时前
借鉴Rust与C#：现代C语言编程的高质量实践指南

作者分享了在现代开发中使用C语言的个人习惯与最佳实践。尽管日常多用C#和Python，作者仍青睐C语言用于原型开发。文章详述了采用C23标准、定义简化的固定长度类型、避免使用空终止字符串等基础技巧。核心在于借鉴Rust的“解析而非验证”理念，利用不透明类型和结构体在C中实现类型安全与API健壮性。此外，还介绍了模拟元组和结果类型的错误处理机制。这些实践为编写更安全、现代化的C代码提供了极具价值的参考。

原文链接：Hacker News

2小时前
防止数据丢失！Google AI Studio 聊天记录一键导出脚本更新

针对Google AI Studio缺乏官方导出功能及潜在的聊天记录丢失风险，社区开发者推出了修改版油猴脚本。该脚本支持自动滚动捕获完整聊天内容，包括AI思维链、用户消息及模型回答，并能一键导出为TXT文本。此外，脚本还优化了UI交互，新增按钮隐藏和失败提醒功能，有效填补了平台原生功能的短板。

原文链接：Linux.do

2小时前
ai-global：一行命令统一所有AI编程工具配置

ai-global 是一款旨在解决开发者配置烦恼的开源工具。在 AI 编程助手层出不穷的当下，不同工具的配置分散且难以管理。该项目通过统一管理配置文件，允许用户仅通过编辑一个文件，即可将设置一键同步至所有相关的 AI 编程工具。这一创新极大地简化了工作流，提升了开发效率，是 AI 辅助编程时代不可或缺的实用效率利器。

原文链接：V2EX 分享发现

3小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始