
Apache Burr 实战: 状态机构建可恢复 AI Agent,对比 LangGraph
TL;DR 写过几个 LLM 应用的人多半都经历过同一条曲线:第一版是几行脚本,prompt 拼好、调一次模型、打印结果,跑通了很开心。等到要做多轮对话、要带记忆、要在某一步插入人工审批、要在出错后从中间继续——那几行脚本就开始膨胀成一团互...

TL;DR 写过几个 LLM 应用的人多半都经历过同一条曲线:第一版是几行脚本,prompt 拼好、调一次模型、打印结果,跑通了很开心。等到要做多轮对话、要带记忆、要在某一步插入人工审批、要在出错后从中间继续——那几行脚本就开始膨胀成一团互...
本文针对开发者社区对火山引擎“方舟 Coding Plan”普遍存在的“模型降智”、“429限流”及“Token消耗异常”等负面评价,提供了基于长期订阅用户的实测视角与技术分析。作者指出,在 AI 编程场景中,所谓的“模型降智”往往并非基础模型能力不足,而是由于长对话中上下文窗口过度膨胀导致的推理质量衰减。为此,作者构建了一套高效的混合编程工作流:利用 Claude Code 或 GPT-4 等高性能模型进行核心逻辑审查与架构设计,而将火山方舟搭载的 DeepSeek 或 GLM 等高性价比模型作为代码执行单元,通过定期手动压缩上下文(`/compact`)和新会话承接旧进度来维持模型的推理效率。文章提到,随着火山方舟近期快速更新 DeepSeek 等前沿模型,加上 49.9 元/月的促销价格,其性价比优势凸显。作者认为,开发者不应盲目排斥国产模型,而应通过掌握上下文管理技巧和构建合理的 Agent 工作流,来有效规避模型短板,实现开发成本与代码质量的最优平衡。
💡 核心观点:所谓的“模型降智”常源于上下文管理失效,采用“强推理+低成本执行”的混合架构正成为兼顾代码质量与成本的最优解。
原文链接:V2EX 分享发现
文章深入探讨了“面向切面编程”(AOP)的复兴,指出在大模型(LLM)时代,这一古老的软件工程范式有望解决现代编程的复杂性难题。作者列举了程序员在开发中需同步兼顾的 17 种关注点,涵盖正确性、效率、安全性、可维护性、日志监控及国际化等。传统 AOP 试图通过“连接点模型”在运行时拦截代码注入逻辑,但其基于语法的匹配机制极其脆弱,被类比为难以调试的“COME FROM”语句。文章提出了一种基于 LLM 的新范式:不再依赖运行时字节码操作,而是由开发者针对每个关注点编写独立的文档或规范(如安全策略或样式指南),交由 LLM 作为静态“编织器”生成最终代码。这种方法利用 LLM 的语义理解能力,能更智能地处理跨领域的非功能性需求,且生成的代码天然具有可读性。作者认为,AOP 的关注点分离思想为组织 Prompt 提供了极佳的框架,未来的 AI 编程可能演变为多 Agent 协作,由不同 Agent 专门负责审查代码的特定维度,从而从根本上改变软件的构建方式。
💡 核心观点:LLM 将 AOP 从机械的代码拦截升级为智能的语义编织,确立以关注点分离为核心的下一代 AI 编程架构。
原文链接:Hacker News
开发者 John Swiderski 正在开发一款名为 HamsterOS 的复古操作系统,该系统专为 386 和 486 时代的经典硬件打造,计划于 2026 年 11 月正式发布。作为一款 32 位多任务图形化操作系统,HamsterOS 的核心亮点在于其极致的体积优化:它能将完整的桌面环境及原生应用套件压缩进单张 1.44MB 的软盘中。尽管以软盘为首选运行介质,该系统也支持硬盘安装。为了提升老旧硬件的稳定性,系统内置了 CMOS 崩溃计数器,能在连续启动失败后自动进入 VGA 安全模式。此外,Swiderski 还发布了配套工具 HamsterWeazle,这是一个用于开源硬件 Greaseweazle 的图形化前端,旨在解决现代缺乏软驱的电脑如何读写老式软盘的难题,极大地降低了复古计算的入门门槛。
💡 核心观点:在软件普遍臃肿的当下,HamsterOS 以极致的代码精简展示了“能力源于高效而非堆砌”的工程美学。
原文链接:Hacker News
美国最高法院以6票对3票的结果作出一项关键裁决,明确裁定执法部门利用“地理围栏搜查令”广泛搜集智能手机位置数据的行为,属于美国宪法第四修正案所界定的“搜查”。这意味着,警方在获取此类敏感数字足迹时,必须提供合理的依据并遵守相应的隐私保护程序。案件源于弗吉尼亚州警方对一名银行抢劫犯的追捕,警方通过强制Google提供特定时间段和区域内的所有用户“位置历史”数据锁定了嫌疑人。尽管政府辩称用户已自愿将位置信息共享给第三方科技公司(即Google),因此不应享有隐私期待,但大法官埃琳娜·卡根撰写的多数意见驳回了这一说法。法院认为,用户开启手机位置服务仅仅是使用现代设备的“普通行为”,并不意味着用户自愿向政府敞开隐私大门。判决书特别指出,Google长期以来通过弹窗提示等方式诱导用户开启位置历史,且并未充分披露数据被频繁记录及可能移交给政府的风险。这一裁决推翻了此前“第三方数据无隐私”的法律逻辑,认定警方这种从海量数据库中“捞针”的侦查手段构成了对个人宪法权利的侵犯。这是自2018年确立手机定位数据隐私权以来,最高法院再次对数字时代的监控边界进行重大界定。
💡 核心观点:裁决实质上宣告了数字时代“第三方数据无隐私”逻辑的终结,明确了个人数字足迹即使是存储在云端,也不应成为警方“大海捞针”式侦查的免费资源。
原文链接:Hacker News
现有的 Web 浏览器模式为远程设备提供体验树立了良好典范,这引发了一个有趣构想:服务器和边缘设备能否通过 SSH 提供一个基于浏览器的图形化“Shell”?该 Shell 将作为一个包含应用的主屏幕,其中每个应用都是一个微型 HTTP 服务器,提供 Web 用户界面。这些服务器通常不使用 localhost 端口,而是利用文件系统上的 Unix domain socket 文件,并配合 SSH 进行加密传输,从而简化了依赖管理并增强了安全性。作者基于此概念开发了名为“Outer Shell”的开源项目及其配套的 SSH 浏览器“Outer Loop”。这套系统允许应用间通过 API 相互发现和调用(例如在一个应用中点击文件在编辑器中打开),为传统的终端命令行界面提供了原生图形化的替代方案。文章指出,随着 AI 编程技术的普及,为不同目标平台编写定制化原生应用代码的成本大幅降低,使得这种结合了 HTML 通用性与原生应用高性能的架构成为可能。这不仅是对传统 Linux 服务器交互方式的革新,也是 Web 技术架构自然演进的新分支。
💡 核心观点:AI 编程消除了多平台适配的边际成本,使“基于 SSH 的原生图形化界面”有望成为替代传统终端和远程桌面的下一代基础设施。
原文链接:Hacker News
美团正式上线了自研的大语言模型LongCat-2.0-Preview,并同步公布了极具竞争力的商业付费计划,旨在通过低价策略吸引开发者和企业用户。该模型名称暗示其可能在长上下文处理方面具备优势,且针对缓存机制做了特别优化。在用户福利方面,新用户只需完成实名认证,即可获赠1000万Tokens的免费额度。付费套餐方面,美团采取了激进的定价模式:入门级月卡仅需9.9元,即可获得5000万Tokens;进阶级月卡为399元,提供高达10亿Tokens的配额。技术细节显示,该模型支持Cache命中免费机制,即缓存命中的部分完全不计入Token资源包消耗,这将大幅降低重复请求和长文本处理的成本。此外,美团还开放了按量付费的API接口。限时优惠期间,输入(命中缓存)的价格低至每百万Tokens 0.04元,输入(未命中缓存)为2元,输出为8元。常规价格虽然有所回升,但相较于行业平均水平仍具备极强价格优势。LongCat-2.0-Preview的上线,标志着美团在AI基础设施层面向公众迈出了重要一步,意图通过极致性价比抢占市场份额。
💡 核心观点:美团以击穿底线的定价入场API市场,通过“缓存免费”和“超低价Tokens”策略,倒逼行业从技术竞赛转向成本与生态的规模之争。
原文链接:Linux.do