标签：Burr

Apache Burr 实战: 状态机构建可恢复 AI Agent，对比 LangGraph

TL;DR 写过几个 LLM 应用的人多半都经历过同一条曲线：第一版是几行脚本，prompt 拼好、调一次模型、打印结果，跑通了很开心。等到要做多轮对话、要带记忆、要在某一步插入人工审批、要在出错后从中间继续——那几行脚本就开始膨胀成一团互...

赞(0)

Toy2026-06-29AI 阅读(8)

前沿哨所

争议中的国产模型：实测火山方舟 Coding Plan 与上下文优化工作流
本文针对开发者社区对火山引擎“方舟 Coding Plan”普遍存在的“模型降智”、“429限流”及“Token消耗异常”等负面评价，提供了基于长期订阅用户的实测视角与技术分析。作者指出，在 AI 编程场景中，所谓的“模型降智”往往并非基础模型能力不足，而是由于长对话中上下文窗口过度膨胀导致的推理质量衰减。为此，作者构建了一套高效的混合编程工作流：利用 Claude Code 或 GPT-4 等高性能模型进行核心逻辑审查与架构设计，而将火山方舟搭载的 DeepSeek 或 GLM 等高性价比模型作为代码执行单元，通过定期手动压缩上下文（`/compact`）和新会话承接旧进度来维持模型的推理效率。文章提到，随着火山方舟近期快速更新 DeepSeek 等前沿模型，加上 49.9 元/月的促销价格，其性价比优势凸显。作者认为，开发者不应盲目排斥国产模型，而应通过掌握上下文管理技巧和构建合理的 Agent 工作流，来有效规避模型短板，实现开发成本与代码质量的最优平衡。

事件分析

从技术角度看，AI 编程工具中的“降智”现象，本质是长上下文窗口（Long Context）技术尚未完美成熟的表现。当输入 Token 数量超过模型最优处理范围时，注意力机制会分散，导致输出质量下降，即“Lost in the Middle”问题。用户提出的混合工作流——使用高阶模型做 Reasoning（推理），低成本模型做 Execution（执行），代表了当前 AI 辅助编程的一种成熟范式。这种“Router”模式不仅降低了 API 调用成本，也通过隔离任务缓解了单一模型的长文处理压力。对于火山方舟等国内云厂商而言，能否提供高效的 Context Caching（上下文缓存）机制和稳定的并发服务，将是留住开发者用户的关键。此次评测显示，国产模型在经过参数微调和工程优化后，在特定垂直领域的编码任务上已具备较强的可用性。

💡 核心观点：所谓的“模型降智”常源于上下文管理失效，采用“强推理+低成本执行”的混合架构正成为兼顾代码质量与成本的最优解。

原文链接：V2EX 分享发现
1分钟前
LLM 重塑 AOP：用大模型终结软件开发的“纠缠”难题
文章深入探讨了“面向切面编程”（AOP）的复兴，指出在大模型（LLM）时代，这一古老的软件工程范式有望解决现代编程的复杂性难题。作者列举了程序员在开发中需同步兼顾的 17 种关注点，涵盖正确性、效率、安全性、可维护性、日志监控及国际化等。传统 AOP 试图通过“连接点模型”在运行时拦截代码注入逻辑，但其基于语法的匹配机制极其脆弱，被类比为难以调试的“COME FROM”语句。文章提出了一种基于 LLM 的新范式：不再依赖运行时字节码操作，而是由开发者针对每个关注点编写独立的文档或规范（如安全策略或样式指南），交由 LLM 作为静态“编织器”生成最终代码。这种方法利用 LLM 的语义理解能力，能更智能地处理跨领域的非功能性需求，且生成的代码天然具有可读性。作者认为，AOP 的关注点分离思想为组织 Prompt 提供了极佳的框架，未来的 AI 编程可能演变为多 Agent 协作，由不同 Agent 专门负责审查代码的特定维度，从而从根本上改变软件的构建方式。

事件分析

技术视角下，该文的核心价值在于将 AOP 的架构思想与 LLM 的语义能力结合。传统编程工具难以处理的“横切关注点”（如日志、校验），在 LLM 基于语义理解的生成模式下变得轻而易举，这标志着代码生成从简单的“补全”进化到了复杂的“工程编织”阶段。在产业层面，这种思路为构建专业的 AI 编程架构提供了蓝图，即通过模块化的 Prompt 或 Agent 设计，将复杂的工程需求拆解为独立的语义描述。这将极大提升大型软件项目中 AI 代码的一致性与可控性，未来可能会出现基于此架构的“需求编织”工具链，进一步模糊自然语言规范与机器执行代码之间的界限。

💡 核心观点：LLM 将 AOP 从机械的代码拦截升级为智能的语义编织，确立以关注点分离为核心的下一代 AI 编程架构。

原文链接：Hacker News
1分钟前
HamsterOS：将完整32位图形系统塞入1.44MB软盘的复古OS
开发者 John Swiderski 正在开发一款名为 HamsterOS 的复古操作系统，该系统专为 386 和 486 时代的经典硬件打造，计划于 2026 年 11 月正式发布。作为一款 32 位多任务图形化操作系统，HamsterOS 的核心亮点在于其极致的体积优化：它能将完整的桌面环境及原生应用套件压缩进单张 1.44MB 的软盘中。尽管以软盘为首选运行介质，该系统也支持硬盘安装。为了提升老旧硬件的稳定性，系统内置了 CMOS 崩溃计数器，能在连续启动失败后自动进入 VGA 安全模式。此外，Swiderski 还发布了配套工具 HamsterWeazle，这是一个用于开源硬件 Greaseweazle 的图形化前端，旨在解决现代缺乏软驱的电脑如何读写老式软盘的难题，极大地降低了复古计算的入门门槛。

事件分析

HamsterOS 项目展示了在极端资源受限环境下的底层编程实力与系统优化艺术。在软件功能日益臃肿、依赖海量内存的当下，重新审视 386/486 架构并实现高效的多任务调度，体现了对计算机体系结构的深刻理解。该项目不仅服务于复古计算爱好者，更为现代嵌入式开发提供了“代码瘦身”的参考案例。同时，配套的 HamsterWeazle 工具解决了现代硬件与 Vintage 存储介质之间的物理接口隔阂，构建了从软件编写到物理写入的完整生态链。这种软硬件协同开发模式，有效地降低了复古技术探索的门槛，有利于推动老式硬件资源的二次利用与生态繁荣。

💡 核心观点：在软件普遍臃肿的当下，HamsterOS 以极致的代码精简展示了“能力源于高效而非堆砌”的工程美学。

原文链接：Hacker News
1分钟前
美最高法院里程碑裁决：警方利用Google“地理围栏”进行地毯式搜查违宪
美国最高法院以6票对3票的结果作出一项关键裁决，明确裁定执法部门利用“地理围栏搜查令”广泛搜集智能手机位置数据的行为，属于美国宪法第四修正案所界定的“搜查”。这意味着，警方在获取此类敏感数字足迹时，必须提供合理的依据并遵守相应的隐私保护程序。案件源于弗吉尼亚州警方对一名银行抢劫犯的追捕，警方通过强制Google提供特定时间段和区域内的所有用户“位置历史”数据锁定了嫌疑人。尽管政府辩称用户已自愿将位置信息共享给第三方科技公司（即Google），因此不应享有隐私期待，但大法官埃琳娜·卡根撰写的多数意见驳回了这一说法。法院认为，用户开启手机位置服务仅仅是使用现代设备的“普通行为”，并不意味着用户自愿向政府敞开隐私大门。判决书特别指出，Google长期以来通过弹窗提示等方式诱导用户开启位置历史，且并未充分披露数据被频繁记录及可能移交给政府的风险。这一裁决推翻了此前“第三方数据无隐私”的法律逻辑，认定警方这种从海量数据库中“捞针”的侦查手段构成了对个人宪法权利的侵犯。这是自2018年确立手机定位数据隐私权以来，最高法院再次对数字时代的监控边界进行重大界定。

事件分析

此次裁决对数字取证技术与科技行业的合规要求产生了深远影响。从技术视角来看，法院否定了“反向位置搜索”作为常规侦查手段的法律豁免权，这直接针对了当前执法部门依赖大规模数据聚合（如Google Sensorvault）来锁定嫌疑人的作业模式。判决确立的核心逻辑在于，数据的“云端存储”属性或“第三方持有”状态不再自动成为警方绕取搜查令的理由。对于Google等科技巨头而言，这一判决虽然可能增加其处理执法请求的法律成本，但也极大地缓解了其作为“ surveillance surrogate”（执法代理）面临的道德与舆论压力。未来，为了响应这一判决，科技公司可能会在位置数据的粒度控制、用户授权弹窗的透明度以及执法数据请求的自动化审查流程上进行技术革新，推动行业向更精细化的隐私工程方向发展。

💡 核心观点：裁决实质上宣告了数字时代“第三方数据无隐私”逻辑的终结，明确了个人数字足迹即使是存储在云端，也不应成为警方“大海捞针”式侦查的免费资源。

原文链接：Hacker News
25分钟前
基于 SSH 的原生图形化 Shell：AI 时代重构远程服务器交互体验
现有的 Web 浏览器模式为远程设备提供体验树立了良好典范，这引发了一个有趣构想：服务器和边缘设备能否通过 SSH 提供一个基于浏览器的图形化“Shell”？该 Shell 将作为一个包含应用的主屏幕，其中每个应用都是一个微型 HTTP 服务器，提供 Web 用户界面。这些服务器通常不使用 localhost 端口，而是利用文件系统上的 Unix domain socket 文件，并配合 SSH 进行加密传输，从而简化了依赖管理并增强了安全性。作者基于此概念开发了名为“Outer Shell”的开源项目及其配套的 SSH 浏览器“Outer Loop”。这套系统允许应用间通过 API 相互发现和调用（例如在一个应用中点击文件在编辑器中打开），为传统的终端命令行界面提供了原生图形化的替代方案。文章指出，随着 AI 编程技术的普及，为不同目标平台编写定制化原生应用代码的成本大幅降低，使得这种结合了 HTML 通用性与原生应用高性能的架构成为可能。这不仅是对传统 Linux 服务器交互方式的革新，也是 Web 技术架构自然演进的新分支。

事件分析

该项目的核心价值在于提出了一种低成本、高安全性的远程服务器图形化交互范式。从技术架构来看，利用 Unix domain socket 结合 SSH 隧道传输 HTTP 流量，巧妙避开了公网端口暴露的风险和复杂的 TLS 配置，将安全边界收敛在 SSH 权限管理体系内。这种“反向”的 RDP/VNC 模式（即服务端推送 UI，而非客户端截屏）具有极高的带宽效率和灵活性。更关键的是，作者敏锐地捕捉到了 AI 编程对这一架构的决定性推动作用：在 AI 辅助编码之前，维护跨平台的原生 GUI 库成本过高，而 AI 使得为 Windows、macOS、Linux 编写特定客户端变得轻而易举。这预示着服务器管理工具将从“黑底白字”的终端时代，迈向由 AI 驱动的“原生应用分发”时代，未来的云服务可能不仅仅是 API 的调用，还将包含标准化、可组合的图形化操作界面。

💡 核心观点：AI 编程消除了多平台适配的边际成本，使“基于 SSH 的原生图形化界面”有望成为替代传统终端和远程桌面的下一代基础设施。

原文链接：Hacker News
25分钟前
美团推出LongCat-2.0-Preview大模型：9.9元5000万Tokens，API定价刷新行业下限
美团正式上线了自研的大语言模型LongCat-2.0-Preview，并同步公布了极具竞争力的商业付费计划，旨在通过低价策略吸引开发者和企业用户。该模型名称暗示其可能在长上下文处理方面具备优势，且针对缓存机制做了特别优化。在用户福利方面，新用户只需完成实名认证，即可获赠1000万Tokens的免费额度。付费套餐方面，美团采取了激进的定价模式：入门级月卡仅需9.9元，即可获得5000万Tokens；进阶级月卡为399元，提供高达10亿Tokens的配额。技术细节显示，该模型支持Cache命中免费机制，即缓存命中的部分完全不计入Token资源包消耗，这将大幅降低重复请求和长文本处理的成本。此外，美团还开放了按量付费的API接口。限时优惠期间，输入（命中缓存）的价格低至每百万Tokens 0.04元，输入（未命中缓存）为2元，输出为8元。常规价格虽然有所回升，但相较于行业平均水平仍具备极强价格优势。LongCat-2.0-Preview的上线，标志着美团在AI基础设施层面向公众迈出了重要一步，意图通过极致性价比抢占市场份额。

事件分析

LongCat-2.0-Preview的发布不仅是美团技术实力的展示，更是一次对现有大模型API市场价格体系的强力冲击。从技术规格来看，明确区分“Cache命中”与“未命中”计费，并实行Cache免费策略，说明该模型架构针对高频重复读取和长文档检索场景做了深度优化，直击当前RAG（检索增强生成）应用中的成本痛点。从产业格局分析，9.9元5000万Tokens的定价远低于DeepSeek、阿里等厂商的同类产品，甚至接近于“赔本赚吆喝”的成本价。这表明美团并不急于在API调用上实现盈利，而是意在迅速构建开发者生态，通过高性价比工具锁死用户，并将其作为流量入口导入美团的更广泛服务体系。此举可能迫使其他大模型厂商在价格跟进上做出反应，加速行业从“参数竞赛”向“应用落地与成本控制”阶段的转型。

💡 核心观点：美团以击穿底线的定价入场API市场，通过“缓存免费”和“超低价Tokens”策略，倒逼行业从技术竞赛转向成本与生态的规模之争。

原文链接：Linux.do
25分钟前