谷歌推出Gemini 3.1 Flash Live:专为实时语音与视觉AI Agent打造
谷歌AI负责人Logan Kilpatrick正式发布了代号为“Gemini 3.1 Flash Live”的新模型。这是一款专为构建具备实时语音和视觉能力的AI Agent而打造的底层技术。据官方透露,团队在过去一年多时间里,专注于模型架...
谷歌AI负责人Logan Kilpatrick正式发布了代号为“Gemini 3.1 Flash Live”的新模型。这是一款专为构建具备实时语音和视觉能力的AI Agent而打造的底层技术。据官方透露,团队在过去一年多时间里,专注于模型架...
近期,多位科技爱好者在社区反馈,热门的大模型中转服务 Antigravity 出现了严重的额度缩减问题。实测数据显示,虽然轻量级的 Gemini Flash 模型额度尚且稳定,但高性能的 Gemini 3.1 Pro 以及 Claude S...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
开发者发布了开源项目 Gemini-Skill,利用 Puppeteer 和 CDP 协议将 Gemini 网页版的生图能力封装为标准 MCP 接口。该项目通过精细的反反爬参数配置和模拟真人操作,允许用户在无需申请付费 API Key 的情...
针对大模型 Agent 开发中生图 API 昂贵且受限的痛点,该项目利用 Puppeteer 和 Chrome DevTools Protocol (CDP) 技术,将 Gemini 网页版的生图能力封装为标准 MCP 服务。项目采用守护进...
据社区反馈,谷歌已开始在 Gemini 官网灰度测试其最新的音乐生成模型——Lyria-3(包括 clip-preview 和 pro-preview 版本)。实测显示,该模型在多语言歌词生成方面表现优异,特别是中文歌曲的生成质量显著提升,...
一位用户在体验Google Gemini时遭遇了典型的AI“幻觉”事件。因OpenAI服务问题转用Gemini后,该用户在查询事业单位的公开在编人数及薪资数据时,不仅无法获得正确结果,反被AI信誓旦旦地告知“数据未公开”并遭到反向教育。而在...
VoxSight 是一款基于 Google Gemini 多模态技术的 Chrome 扩展,通过语音指令实现对网页的精准操控。用户只需说出“点击搜索”等命令,扩展即可利用截屏分析技术,通过 AI 理解界面并模拟点击、滚动等操作。该工具采用 ...
近期,科技社区出现关于 Google Gemini 模型的集中吐槽。多位资深用户反映,该 AI 工具在未经官方说明的情况下,出现了严重的性能退化现象。此前在自媒体写作、结构化生成及格式调整方面表现出色的 Gemini,突然变得无法正常输出带...
谷歌 Gemini Embedding 2 推出原生视频嵌入功能,能够将原始视频直接映射至 768 维向量空间,彻底跳过了语音转录和帧描述等中间步骤。这一突破使得自然语言查询(如“绿色车别停我”)可直接在向量层面与视频片段进行比对。开发者利...
近期多位开发者反馈,Google 的 Vertex AI 渠道出现严重的稳定性问题,在调用 Gemini 模型时频繁遭遇 429(资源耗尽)错误,导致对话体验极差。这与此前 Vertex AI 稳定性优于 Google AI Studio ...