AI大模型周刊·第4期｜三巨头火拼:Pulse挖墙脚、Cursor 2.0狂飙、Claude抢企业

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

期数: 第4期
周期: 2025-10-25 至 2025-10-31
发布日期: 2025-10-31
作者: toy

📮 关于本周刊
AI大模型周刊追踪ChatGPT、Claude、Cursor等主流AI工具的最新动态,用Linus式批判思维解读产品更新、行业竞争和用户真实反馈。每周五发布,帮你看清AI工具的实用价值与真实痛点。

TL;DR

ChatGPT Pulse全球开放:异步研究能力挑战传统搜索,每周处理100万+心理健康信号
Cursor融资9亿美元估值99亿:自研Composer模型速度快4倍,8并行代理改变编码范式
Claude宕机37分钟引发信任危机:官方被指"淡化问题",拒绝率降至<10%但欺骗风险上升
ChatGPT Go进入9个新市场:8个欧洲国家+巴西,低价订阅战全面升级
Cursor新定价:Pro $20 vs Ultra $200,20倍使用量差距引发免费用户不满
Claude记忆空间500k tokens:企业级隐私优先,支持工作/个人分区
Reddit 5000人吐槽GPT-5:"感觉像降级",OpenAI被迫加倍限额恢复GPT-4o
Cursor开发者称生产力提升3x:但Composer被批"鲁莽如初级开发者"

本周时间线

10月23日:ChatGPT共享项目上线(免费版5文件限制引发吐槽)
10月28日:ChatGPT Go登陆巴西
10月29日:Cursor 2.0+Composer模型重磅发布
10月30日:ChatGPT短暂中断(免费用户受影响)
10月30日:Anthropic限时免费月活动(公司邮箱注册)
10月31日:Claude宕机37分钟(官方称已修复,用户质疑)

ChatGPT:个性化与心理健康的双刃剑

核心更新解析

本周ChatGPT的更新呈现"全球扩张+功能深化"双线并进战略。

1. Pulse异步研究:你的"夜间AI助理"

技术机制:

基于聊天历史、日历、Gmail等App数据,每晚自动研究
第二天推送可视化摘要
支持自定义研究主题(本地事件、技能提示等)
thumbs up/down反馈优化研究方向

vs 传统搜索引擎:

维度	传统搜索(Google/Bing)	ChatGPT Pulse
触发方式	用户主动查询	AI后台异步研究
输出形式	链接列表	结构化摘要
个性化	基于搜索历史	基于全量App数据
时效性	实时	每日推送

消除的特殊情况:
不再需要"想起来要查什么"这个前置步骤,AI主动发现你可能关心的信息。

2. Gmail/Calendar集成全球开放(Plus用户)

会议转录+自动总结
生成跟进邮件或代码
"会议→代码"直接链路:从需求讨论到执行,减少中间环节

3. 语音笔记(Pro/Enterprise/Edu)

实时转录会议/脑暴
自动提取行动项
用户反馈:"革命性,Team协作利器"

4. 记忆增强(免费用户开始rollout)

引用近期对话提升相关性
需App v1.2025.147+
逐步推送中

5. GPT-4.5开放(Pro用户)

iOS优化文本选择和快速操作
性能提升细节未公开

6. ChatGPT Go地域扩张

10月30日:8个欧洲市场

奥地利、捷克、丹麦、挪威、波兰、葡萄牙、西班牙、瑞典

10月28日:巴西上线

Go版权益:

更多对话额度
更大文件上传
扩展图像生成
进阶数据分析
更长记忆

7. 共享项目功能(10月23日)

团队共享上传文件和定制指令
免费版限制:5个文件、5个协作者
Go/Plus版配额更高

数据支撑

心理健康信号:每周100万+用户分享"潜在自杀念头"
用户不满:Reddit 5000人吐槽GPT-5上下文限制、响应慢、"过于保守"
服务中断:10月30日短暂中断,影响免费用户

Linus式批判

✅ 好品味:

Pulse消除复杂性:让AI在后台处理碎片化研究,用户不需要主动想"该查什么"
Gmail/Calendar集成:"会议→代码"链路直接从需求到执行,减少手动转换

❌ 垃圾设计:

GPT-5上下文限制rollback:典型的"Never break userspace"反面教材
- 用户期待:更强能力
- 实际体验:"感觉像降级"(Reddit 5000人)
- OpenAI回应:加倍限额并恢复GPT-4o = 承认失败
共享项目免费版5文件限制:耍流氓式逼氪
- 协作场景5个文件根本不够
- Go/Plus定价策略过于露骨

🤔 争议点:

心理健康支持的双面性:
- 积极面:100万+信号→资源链接、危机干预
- 隐私面:这些敏感数据如何存储?用于训练吗?
Pulse噪音风险:异步研究可能推送无关信息,需长期调教

用户反馈

积极:

"Pulse像私人助理"(学生群体)
"语音笔记革命性"(企业Team协作)

负面:

"GPT-5响应慢且过于保守"
"安全更新后有害回答反而增多"(隐私担忧)
"共享项目5文件不够用"

ChatGPT Pulse工作流程图

Cursor:自研模型的独立宣言

核心更新:2.0版本革命性升级

1. Composer自研模型

性能数据:

速度:比同类模型快4倍
响应时间:大部分交互30秒内完成

战略意义:

摆脱OpenAI/Anthropic API依赖
降低成本(自有模型无需分成)
控制产品路线图(不受第三方限制)

技术推测:为什么能快4倍?

专门优化代码生成:通用模型处理多模态,Composer专注代码,减少推理开销
上下文压缩:利用AST(抽象语法树)压缩,减少token消耗
本地部分推理:可能部分计算在本地,减少网络延迟

2. 8个并行代理

机制:

利用Git工作树或远程机器隔离环境
同时处理同一任务→挑选最优解
适用复杂多步任务

vs 单代理迭代:

维度	单代理	8并行代理
探索方式	线性尝试	并行探索
错误处理	回溯重试	多方案对比
计算成本	1x	8x
质量	一般	更优

风险:计算成本8倍→Ultra $200定价合理性

3. Background Agents

触发方式:从Linear自动启动
处理能力:

Bug修复
功能构建
反馈响应

优势:消除"记得启动AI"的操作负担

开发者在Linear标记bug
Cursor自动启动修复
PR自动生成

Linus评价:这才是实用主义,工具服务流程,而非流程适应工具

4. 内置浏览器

代码审查
自动测试
实时预览
闭环优化:修改→测试→调整

5. 原生语音模式

降低编码心理门槛
用户反馈:"让编码不那么可怕"

6. Hooks beta版

审计代理使用
阻塞危险命令
保护敏感信息(redacted秘密)

新定价模型

计划	价格	权益	用户反馈
Free	$0	限制Composer可用性	"耍流氓式逼氪"
Pro	$20/月	$20模型推理额度<br>无限Auto模型访问	"适合个人开发者"
Ultra	$200/月	20x Pro使用量	"适合团队,个人ROI存疑"

定价策略:

统一请求为基础(替代旧的按功能计费)
Free限制Composer=强迫付费
Ultra适合团队,个人开发者ROI存疑

融资与估值

融资额:9亿美元
估值:99亿美元
意义:挑战OpenAI/Anthropic的编程AI垄断,资本认可自研模型战略

Linus式批判

✅ 好品味:

Background Agents从Linear自动触发:
- 消除"记得启动AI"的复杂性
- 工具服务流程,而非流程适应工具
Git工作树隔离:并行代理不互相污染,优雅的数据结构设计

❌ 垃圾设计:

Free限制Composer:
- 宣传"让每个人都能写代码"
- 实际"让付费用户写代码"
- 自相矛盾的商业策略
Composer"鲁莽如初级开发者"(用户反馈):
- 代码审查机制缺失
- 速度快但质量不稳定=过早优化

🟡 凑合:

Auto模型"无用"(用户反馈):可能是为衬托Composer的付费价值
更新频繁"像Discord":快速迭代 vs 稳定性权衡

用户反馈

积极:

"从文件转向功能,UX革命性"
"并行代理改变编码范式"
"浏览器是游戏改变者"
"生产力提升3x"

负面:

"像vibe coding app,代码焦点偏移"
"Composer鲁莽如初级开发者"
"测试快捷键中断工作流"
"完全依赖代理,宕机时无所适从"

Cursor 2.0架构图

Claude:企业市场的攻坚战

核心更新:垂直行业+浏览器扩展

1. Claude for Chrome试点

规模:1000用户
功能:日历/邮件管理等浏览器任务
安全:

提示注入防御
用户确认风险行动
反馈优化安全机制

提示注入防御机制(推测):

上下文隔离:网页内容 vs 用户指令分别处理
风险行动白名单:删除/支付需用户确认
异常检测:识别突兀的指令跳转

2. 行业扩展

金融服务:Claude for Financial Services更新
生命科学:Claude Life Sciences正式推出

覆盖:文献综述→数据分析全流程
Excel插件beta版(Max/Enterprise/Teams用户)
反馈:1000用户参与

3. Skills功能

跨App/API一致任务指令
企业场景标准化操作

4. Microsoft 365 Copilot集成

模型:Sonnet 4 / Opus 4.1
战略意义:

进入微软生态
对标ChatGPT企业版
抢夺To B市场份额

5. 自动记忆升级

容量:500k tokens

vs ChatGPT/Cursor:

维度	Claude	ChatGPT	Cursor
容量	500k tokens	<100k(推测)	未公开
分区机制	独立空间(工作/个人)	单一记忆池	–
隐私透明度	可查看/编辑/删除	较低	–
导入导出	✅支持其他聊天机器人	❌不支持	–
企业级功能	✅	⚠️	–
价格	Pro $18	Plus $20	–

特性:

无需手动标记
查看/编辑/删除特定记忆
独立"记忆空间"(区分工作/个人)
导入/导出其他聊天机器人记忆

6. Claude Code Web版

从命令行→浏览器
面向:Pro/Max订阅用户
方便在浏览器里直接编码/调试/构建

7. 限时免费月

条件:10月30日 7:59 AM PT前,公司邮箱注册
限制:首次订阅用户
反馈:"很多开发者感到惊喜"

8. 条款更新

允许opt-in数据训练
保留期:5年
争议:隐私边界模糊

9. Claude 3.7 Sonnet

支持实时/思考响应控制

10. 宕机事件(10月31日)

时长:官方称37分钟
用户反馈:

部分仍无法登录
被指"淡化问题"
Hacker News热议:"对用户不尊重"

数据支撑

Chrome试点:1000用户
拒绝率降至<10%(但场景测试显示欺骗风险)
宕机:官方称37分钟,用户质疑

Linus式批判

✅ 好品味:

记忆空间分离工作/个人:
- 消除上下文污染的特殊情况
- 不用担心工作对话泄露个人信息
提示注入防御:主动应对安全威胁,而非事后补救

❌ 垃圾设计:

宕机处理"淡化问题":
- 官方:37分钟
- 用户:部分持续无法登录
- 违反向后兼容原则:可靠性是服务的基础契约
- Hacker News:"对用户不尊重"

🤔 争议点:

条款变更允许opt-in训练:
- 5年保留期意味着什么?
- 企业用户能接受吗?
拒绝率<10% vs 欺骗风险:
- 为了提升可用性降低安全阈值?
- 实用主义 vs 安全性权衡

用户反馈

积极:

"Chrome试点向AI生活新方式迈进"
"Excel插件效率提升"
"Life Sciences从孤立到全流程支持"
"记忆功能企业级实用,隐私优先"
"免费Pro月惊喜"

负面:

"宕机数百用户受影响,无更新死寂"
"条款变更引发数据隐私担忧"

三家记忆功能对比表

用户反馈分析:期待与失望并存

积极派(按产品)

产品	典型反馈	用户群体	场景
ChatGPT Pulse	"像私人助理一样实用"	学生	学习研究
ChatGPT语音笔记	"革命性,协作利器"	企业Team	会议管理
Cursor并行代理	"改变编码范式"	开发者	复杂任务
Cursor生产力	"提升3x"	开发者	日常开发
Claude Chrome试点	"向AI生活新方式迈进"	早期用户	浏览器任务
Claude记忆空间	"企业级实用,隐私优先"	金融/医疗	敏感数据

批判派(按痛点)

痛点	典型吐槽	产品	影响范围
性能倒退	"GPT-5感觉像降级"	ChatGPT	Reddit 5000人
上下文限制	"dumber行为"	ChatGPT	OpenAI加倍限额
代码质量	"Composer鲁莽如初级开发者"	Cursor	资深开发者
产品定位	"像vibe coding app"	Cursor	代码焦点偏移
服务稳定性	"宕机无更新死寂"	Claude	Hacker News热议
隐私担忧	"条款变更模糊边界"	Claude	企业用户

行业影响:三条战线的竞争

1. 个人用户:价格战升级

ChatGPT Go:

低价扩张至9个国家(8欧洲+巴西)
培养用户习惯→锁定付费

Claude免费月:

公司邮箱注册即可
首次订阅用户

Cursor Free限制:

倒逼付费(限制Composer)

影响:

降低AI工具使用门槛
用户习惯培养后锁定付费路径

2. 开发者:编程门槛革命

Cursor宣称:"让每个人都能写代码"

实际情况:

依赖症风险:宕机时"无所适从"
代码审查能力被弱化
Junior开发者就业冲击?

数据:用户称生产力提升3x,但Composer质量不稳定

3. 企业客户:垂直行业争夺

产品	垂直行业	优势
Claude	金融/生命科学/Microsoft 365	隐私承诺
ChatGPT	Enterprise版+心理健康支持	生态整合
Cursor	团队协作(Ultra $200)	开发效率

竞争焦点:

隐私承诺(Claude优势)
生态整合(ChatGPT优势)
开发效率(Cursor优势)

避坑指南:5条实战建议

1. 不要完全依赖单一工具

案例:Claude宕机37分钟,部分用户工作中断

方案:

至少准备2个AI工具(如ChatGPT + Claude)
关键工作流设置备份路径
成本:Pro订阅 x2 ≈ $40/月

2. 警惕Pulse异步研究噪音

问题:推送无关信息,分散注意力

调教方法:

初期高频thumbs down训练
精准定义研究主题
关闭低价值推送类别
至少调教2周才能见效

3. Cursor免费计划是陷阱

限制:Composer不可用=核心功能缺失

决策建议:

试用后评估ROI
Pro $20:适合个人开发者
Ultra $200:适合团队(3人以上)
警惕Auto模型"无用"问题

4. 隐私设置检查(Claude)

风险:条款变更后opt-in训练默认开启?

操作清单:

登录检查数据使用设置
企业用户要求明确SLA(服务等级协议)
敏感项目避免上传原始数据
定期审计记忆内容

5. GPT-5慎用,等稳定后再切换

现状:

上下文限制
响应慢
"过于保守"
Reddit 5000人吐槽

建议:

继续用GPT-4o
关注OpenAI DevDay后续修复
生产环境别当小白鼠
至少等1-2个月稳定期

Linus式总结:好品味、垃圾与争议

【品味评分】

🟢 ChatGPT Pulse – 好品味

理由:消除"主动查询"的复杂性,AI后台异步研究=数据结构优先思维
类比:Linux的异步I/O,不阻塞主线程

🟢 Cursor Background Agents – 好品味

理由:从Linear自动触发,消除手动启动的操作负担
类比:Git hooks,事件驱动 > 手动执行

🟡 Cursor 2.0 – 凑合

好:自研Composer快4倍,并行代理提升复杂任务质量
坏:Composer"鲁莽",Auto"无用",代码审查机制缺失
总结:速度优先,但质量不稳定=过早优化

🟢 Claude记忆空间 – 好品味

理由:工作/个人分区,消除上下文污染
类比:Linux的namespace隔离

🔴 Claude宕机处理 – 垃圾

理由:"淡化问题"=对用户不尊重
违反:"Never break userspace",可靠性是基础契约
类比:内核panic后不给堆栈信息

🔴 GPT-5上下文限制rollback – 垃圾

理由:用户期待升级,实际体验降级
违反:"Never break userspace"的典型反面教材
OpenAI回应:加倍限额恢复GPT-4o(承认失败)

【本周最大垃圾】

GPT-5的向后兼容失败

Reddit 5000人吐槽
"感觉像降级"
OpenAI被迫回滚
教训:性能优化不能牺牲用户体验

【本周最佳设计】

Cursor Background Agents

从Linear自动触发
消除"记得启动AI"的复杂性
这才是实用主义:工具服务流程

【本周最大争议】

Claude条款变更 vs 隐私承诺

允许opt-in训练 + 5年保留期
企业用户能接受吗?
隐私优先 vs 模型改进的权衡

【下周关注】

OpenAI DevDay(11月初?)
- 会修复GPT-5吗?
- Sora正式发布?
- 企业版新功能?
Cursor定价调整
- Free限制Composer引发不满
- 会调整策略吗?
- 用户流失数据?
Claude Chrome试点反馈
- 1000用户试用后扩展吗?
- 安全机制优化?
- 正式版时间表?

数据来源:

OpenAI/Anthropic/Cursor官网
TechCrunch、Neowin、Bloomberg、Times of India
Reddit (r/ChatGPT)、Hacker News
X(Twitter)用户实时反馈

声明:
本周刊基于公开信息分析,技术推测部分未经官方确认。投资/采购决策请自行调研。

关于作者toy:
高仙机器人云服务技术负责人,关注AI工具、大模型、商用机器人。信奉Linus式实用主义:好代码消除特殊情况,好产品解决真问题。

如果你觉得这篇周刊有用,欢迎分享给同样关注AI工具动态的朋友。

下周见,我会继续追踪三巨头的新动向,看看GPT-5能否修复,Cursor定价会不会调整,Claude Chrome试点能否扩展。

记住,AI工具是为你服务的,不是让你服务它的。选最适合你的,不是最贵的。

—— toy

服务商	输入价格	输出价格	月成本估算*	省钱幅度
Anthropic官方	$3.0	$15.0	$65	基准
OpenRouter	$2.5	$12.5	$52	20%
AnyRouter	$1.8	$9.0	$37	43%
智谱GLM套餐	-	-	$7 (Lite套餐)	89%
SiliconFlow	$1.5	$7.5	$33	49%

服务商	价格等级	稳定性	国内直连	支持工具	免费额度	最佳场景
AnyRouter	⭐⭐⭐ 中	⭐⭐⭐⭐ 高	✅ 是	Claude Code, Codex	无	国内用户、稳定性优先
智谱GLM	⭐⭐⭐⭐⭐ 极低	⭐⭐⭐⭐⭐ 极高	✅ 是	10+ CLI工具	新用户送额度	预算敏感、套餐制可控
OpenRouter	⭐⭐⭐ 中	⭐⭐⭐⭐ 高	❌ 需代理	全平台通用	免费模型可选	国际用户、模型选择丰富
SiliconFlow	⭐⭐⭐⭐ 低	⭐⭐⭐ 中	✅ 是	Claude Code, Cursor	赠2000万tokens	新用户、免费额度充足
DeepSeek官方	⭐⭐⭐⭐⭐ 极低	⭐⭐⭐⭐ 高	✅ 是	支持OpenAI格式	无	DeepSeek模型专用
百度云	⭐⭐⭐⭐⭐ 极低	⭐⭐⭐⭐ 高	✅ 是	通过OneAPI接入	新用户送额度	超低价、国内企业
腾讯云	⭐⭐⭐⭐ 低	⭐⭐⭐⭐⭐ 极高	✅ 是	企业级全支持	试用额度	企业用户、SLA保障

服务商	输入	输出	备注
Anthropic官方	$3.0	$15.0	基准价格
AnyRouter	$1.8	$9.0	国内优化线路
OpenRouter	$2.5	$12.5	国际标准价
智谱GLM	-	-	套餐制：Lite $7/5h额度

服务商	输入	输出	特殊优惠
DeepSeek官方	¥1.0	¥2.0	错峰50%折扣(00:30-08:30)
硅基流动	¥0.8	¥1.6	新用户赠2000万tokens
百度云	¥0.2	¥0.8	最低价
阿里百炼	¥0.8	¥1.6	企业级稳定
腾讯云	¥0.4	¥1.6	SLA 99.95%

套餐	价格	额度有效期	适用场景	等效官方价值
Lite	$7	5小时	轻度使用、学习测试	$25
Pro	$14	10小时	中度使用、日常开发	$60
Max	$28	20小时	重度使用、团队协作	$120

任务类型	推荐模型	理由
代码生成	deepseek-ai/DeepSeek-V3	代码能力强，速度快
架构设计	Qwen/Qwen2.5-72B-Instruct	长文本理解好
快速原型	THUDM/glm-4-9b-chat	超低延迟

场景	推荐方案	理由
个人学习	SiliconFlow免费额度	2000万tokens足够学习半年
日常开发	智谱GLM Pro套餐	成本可控，稳定性高
深夜工作	DeepSeek错峰	75%折扣，价格低至¥0.5/M
企业项目	腾讯云/阿里云	SLA保障，发票齐全
多模型实验	OpenRouter	100+模型随意切换
出海业务	OpenRouter国际版	全球CDN，延迟低

模型	任务类型	成本	性价比
Claude-4 Opus	复杂架构设计	$4.2	⭐⭐
Claude-4 Sonnet	通用代码生成	$0.6	⭐⭐⭐⭐⭐
DeepSeek-V3	代码补全	$0.14	⭐⭐⭐⭐⭐
GLM-4-Flash	简单重构	$0.05	⭐⭐⭐⭐

场景	首选	备选	避开
国内个人	智谱GLM	SiliconFlow	OpenRouter(需代理)
国际个人	OpenRouter	DeepSeek官方	国内云厂商(国际慢)
企业稳定	腾讯云	阿里云	小服务商
学生学习	SiliconFlow	智谱GLM Lite	官方API(太贵)
深夜工作	DeepSeek错峰	-	高峰期用DeepSeek
多模型实验	OpenRouter	Claude Code Router	单一服务商

TL;DR

本周时间线

ChatGPT:个性化与心理健康的双刃剑

核心更新解析

1. Pulse异步研究:你的"夜间AI助理"

2. Gmail/Calendar集成全球开放(Plus用户)

3. 语音笔记(Pro/Enterprise/Edu)

4. 记忆增强(免费用户开始rollout)

5. GPT-4.5开放(Pro用户)

6. ChatGPT Go地域扩张

7. 共享项目功能(10月23日)

数据支撑

Linus式批判

用户反馈

Cursor:自研模型的独立宣言

核心更新:2.0版本革命性升级

1. Composer自研模型

2. 8个并行代理

3. Background Agents

4. 内置浏览器

5. 原生语音模式

6. Hooks beta版

新定价模型

融资与估值

Linus式批判

用户反馈

Claude:企业市场的攻坚战

核心更新:垂直行业+浏览器扩展

1. Claude for Chrome试点

2. 行业扩展

3. Skills功能

4. Microsoft 365 Copilot集成

5. 自动记忆升级

6. Claude Code Web版

7. 限时免费月

8. 条款更新

9. Claude 3.7 Sonnet

10. 宕机事件(10月31日)

数据支撑

Linus式批判

用户反馈

用户反馈分析:期待与失望并存

积极派(按产品)

批判派(按痛点)

行业影响:三条战线的竞争

1. 个人用户:价格战升级

2. 开发者:编程门槛革命

3. 企业客户:垂直行业争夺

避坑指南:5条实战建议

1. 不要完全依赖单一工具

2. 警惕Pulse异步研究噪音

3. Cursor免费计划是陷阱

4. 隐私设置检查(Claude)

5. GPT-5慎用,等稳定后再切换

Linus式总结:好品味、垃圾与争议

【品味评分】

【本周最大垃圾】

【本周最佳设计】

【本周最大争议】

【下周关注】

相关推荐

评论 抢沙发

置顶推荐

快讯

CLI编程工具接入第三方API省钱80%完全指南：Claude Code/Cursor/Codex 7大服务商横向对比

TL;DR (30秒快读)

一、引言：官方API的定价陷阱

痛点：月费$20只是开始

数据：第三方能省多少钱？

二、架构原理：CLI工具如何调用大模型API

2.1 标准调用链路

2.2 核心技术要点

2.3 为什么第三方更便宜？

三、7大服务商横向对比

3.1 完整对比表

3.2 价格详细对比

Claude-4 Sonnet价格（每百万tokens）

DeepSeek-V3价格（每百万tokens）

四、统一配置模板：消除重复步骤

4.1 配置模式分类

评论抢沙发