本地部署大模型实测:M3 Max 也不行,温度破百且易卡顿
一位科技博主在配备 64GB 内存的 MacBook Pro M3 Max 上实测了本地部署 Qwen3.5 9B 模型。实测发现,虽然基础推理占用内存不高,但在运行类似 Claude Code 的复杂应用时,GPU 温度瞬间飙升至 100...
一位科技博主在配备 64GB 内存的 MacBook Pro M3 Max 上实测了本地部署 Qwen3.5 9B 模型。实测发现,虽然基础推理占用内存不高,但在运行类似 Claude Code 的复杂应用时,GPU 温度瞬间飙升至 100...
AI 初创公司 PrismML 宣布推出首批“商业可行”的 1-bit 权重大语言模型——1-Bit Bonsai 系列。该模型基于加州理工学院的突破性研究,通过极致的量化技术,在不牺牲精度的前提下实现了极高的智能密度。数据显示,其 8B ...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
这篇文章结合《人工智能简史》的阅读体验,对当前人工智能的发展阶段提出了深刻质疑。作者观察到,虽然GPT引发了AGI热潮,但近期大模型的迭代逐渐陷入边际效应递减,仅靠训练策略调整难以带来质变。通过对比70年代专家系统由日本五代机计划推动的历史...
本文深入探讨了大语言模型(LLM)推理效率的核心瓶颈——KV Cache。文章指出,KV Cache作为模型“记忆”的物理载体,占据了大量GPU显存。通过先进的架构优化,工程师们成功将每个Token的KV Cache大小从300KB大幅压缩...
AI 企业 Cohere 正式宣布推出全新的自动语音识别(ASR)模型 Cohere Transcribe。该模型拥有 20 亿参数,基于 Conformer 架构构建,从零开始训练并支持包括中文在内的 14 种语言。在权威的 Huggin...
本文通过一个“用户冒充审核员”的案例,深刻剖析了当前大语言模型在语境理解上的盲区。文章指出,由于RLHF(人类反馈强化学习)机制,AI被训练成默认“用户即求助者”的对话模式,导致其总是忽略语言细节中的逻辑指代(如“给……过”),强行将用户解...
近日,一款基于AI大模型的创新小程序在V2EX引发关注,致力于利用技术手段解决用户的冲动消费问题。该应用包含两大核心功能:一是“贬值追踪”,通过首页醒目的猩红数字展示用户所有物品的实时贬值金额及综合贬值率,虽由AI估算且精度有限,但视觉冲击...
开发者发布了一款名为hello2cc的插件,旨在打破Claude Code对官方模型的限制。该插件不仅能让第三方大模型API模仿Opus的输出风格,更重要的是使其能像原生模型一样“发现并调用”Claude Code内的Agent、ToolS...
作者基于 OpenClaw 开源项目,分别使用 CrewAI 和 LangGraph 框架开发了两个 AI 日报生成 Demo,旨在通过收集 GitHub 热点和新闻来理解 Agent 的设计模式。然而,在实际测试后作者发现,引入复杂的 A...
一名崇尚“固定任务、固定产出”、回避社交的程序员在 V2EX 发帖表达职业焦虑。他指出,随着大模型(LLM)的普及,日常编写 SDK 和技能的效率大幅提升,这种重复性、非社交的编码工作正面临被 AI 全面取代的风险。该帖子引发了关于“程序员...