
Qwen3.6 27B vs Step3.7 IQ4_XS: 本地大模型量化精度实测
本地大模型怎么选:Qwen3.6 27B BF16 与 Step3.7 IQ4_XS 横评,从量化精度、显存账、编码 benchmark、Agent 适配、推理速度五个维度给一张选型矩阵,附四类使用者落地建议。

本地大模型怎么选:Qwen3.6 27B BF16 与 Step3.7 IQ4_XS 横评,从量化精度、显存账、编码 benchmark、Agent 适配、推理速度五个维度给一张选型矩阵,附四类使用者落地建议。

作者:toy | 覆盖周期:2026.06.13 – 06.19 卷首语 本周是 2026 年第一次能清楚看到”治理变量”压过”模型变量”的一周。 周一晚 OpenAI 被 42 个州的检察长...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。

我最近看了 Austin Marchese 解读 Karpathy 在 AISN 2026 上的发言,被里面一个反常识的小例子卡住了:你问 AI “我去 50 米外的洗车店该开车还是走路”,Claude、Gemini...

有个概念我最近一直在用,叫”聪明区”和”笨蛋区”。提出它的是 Human Layer 的 Dex Hardy:一个大模型刚开始一段新对话时最聪明,因为这时注意力关系最松弛;你每往上下文里塞一个...

我先给一种失败模式起个名字:隐性失败。没有报错,没有警告,没有任何异常提示,你拿到的只是一个错答案。 这是 Bright Data 的 Rafael Levi 在 AI Engineer 大会上一场演讲的主题。他做的是帮 agent 大规模...

一年前,模型支持 100 万 token 上下文还是发布会上的高光环节。现在它更像手机快充,人人都有,没有反而奇怪。Claude、OpenAI、Gemini 在海外,DeepSeek、MiniMax、Kimi、智谱在国内,新发布的模型几乎默...

过去三年,做”语言+图像”的人几乎都在重复一个动作:拿一个已经训得很大的语言模型,死死冻住它,然后在它前面接一个很小的转接头,把图像、视频、传感器数据翻译成它认识的”词”。听起来像凑合,但这条...

Paul 这一讲一开场就先打了个预防针:今天讲的是高度浓缩版的内容,MIT 隔壁的 ALP 那门课才是正经讲大模型,这里只是个高空俯瞰。听到一半我反而觉得,这种”俯瞰”才是真正值钱的。他把一个被无数公众号、技术博客、...

一门课的最后一讲,最能看出讲者真正在想什么。前面 11 讲是在搭骨架,数据、架构、对齐、融合、跨模态迁移、基础模型、强化学习,一块一块拼上去。到最后一讲,Paul Liang 不再讲新算法,而是退一步问:这些东西攒齐了,下一步应该长成什么样...

监督学习像一次考试,你答一道题,老师立刻给分。强化学习不是。强化学习是你下一整盘棋,走了几十步,最后才知道这盘赢没赢,而且没人告诉你哪一步是关键的。这个差别看起来只是”反馈给得晚一点”,但它把整套训练范式都拧到了另一...