
Codex 在自己的执行历史里找补丁
最近社区在传一个”自我蒸馏”的提示词,源头是 OpenAI Codex 团队成员 @VB。意思是让 Codex 回看你最近 30 天的执行记录,把里面反复出现的工作流打包成 Skill,把固定角色封成 Sub-age...

最近社区在传一个”自我蒸馏”的提示词,源头是 OpenAI Codex 团队成员 @VB。意思是让 Codex 回看你最近 30 天的执行记录,把里面反复出现的工作流打包成 Skill,把固定角色封成 Sub-age...
一名资深开发者反馈,近期在体验大模型编程辅助服务时,DeepSeek 模型的表现出现了显著的性能波动。据其详细记录,在 6 月 1 日的实测中,DeepSeek 展现出了极高的性价比和推理速度,在处理复杂编码任务时表现出色,一度被认为可以替代价格昂贵的 Claude Opus 模型。然而,从 6 月 4 日开始,该模型在多轮对话中的表现出现断崖式下跌。核心问题集中在“指令遵循”能力的退化:模型开始频繁忽略用户的明确指令,生成的代码逻辑与需求背道而驰,即便在开发者反复纠正和细化提示词的情况下,依然无法按照预期逻辑实现功能。这种“反向执行”的现象并非偶发的推理幻觉,而是系统性的对齐失效。尽管响应速度尚可,但核心逻辑准确性的缺失使得该模型在当前状态下已无法胜任严肃的开发工作。该事件揭示了部分开源或低成本模型在长期服务一致性和精细指令控制力方面与顶尖闭源模型仍存在的差距。
💡 核心观点:在AI编程赛道,性价比只是入场券,指令遵循的确定性才是开发者信任的基石。
原文链接:Linux.do
本文详细阐述了 Obsidian 如何通过 AI 插件生态,特别是与 DeepSeek 和 Claude 等大模型的结合,转型为 AI 时代的个人知识管理(PKM)主力工具。文章指出,Claudian 等插件实现了从图形界面到语言界面(LUI)的交互变革,用户仅需自然语言指令即可完成文件整理、周报生成、笔记修改及插件安装等操作。特别强调了 DeepSeek V4 模型的引入,凭借其 1M 超长上下文窗口和极低的 API 成本,解决了本地知识库检索的遗忘问题,实现了对海量笔记的精准理解与调用。此外,文章介绍了 Obsidian CLI(命令行界面)作为 AI 与操作系统之间的桥梁,赋予助手批量处理文件、查找孤立笔记等底层权限,大幅提升了自动化水平。配合内置浏览器和官方剪藏插件,Obsidian 构建了一个从信息采集、阅读到写作的全流程闭环。作者认为,相比 Notion 等云端工具,Obsidian 结合本地部署的大模型,在数据隐私、定制自由度及成本控制上展现出更强的竞争力。
💡 核心观点:长上下文大模型与本地笔记软件的深度耦合,正推动个人知识库向具备自动执行能力的 AI 智能体进化。
原文链接:少数派
谷歌在官方博客宣布推出Gemma 4 QAT(量化感知训练)模型,旨在通过先进的压缩技术解决大模型在移动设备和笔记本电脑上的部署难题。作为谷歌开源的轻量级模型家族,Gemma此次更新的核心在于采用了量化感知训练技术,这使得模型在训练阶段就能适应低精度运算环境。相比传统的训练后量化方法,QAT技术能显著减少模型体积并降低内存带宽需求,同时最大程度地保持模型的预测精度和性能。这一优化让开发者能够在智能手机和笔记本电脑等资源受限的硬件上,直接运行高性能AI模型,而无需完全依赖云端算力。这不仅降低了本地应用的延迟,还增强了对用户数据的隐私保护,标志着端侧AI部署技术的重大进步。
💡 核心观点:AI算力的竞争重心正从云端向边缘侧转移,掌握极致压缩与端侧优化能力者将主导下一代AI入口。
原文链接:Hacker News
微软近日开源了一款名为 pg_durable 的 PostgreSQL 扩展,旨在将“持久化执行”能力直接引入数据库内部。该工具允许后端和数据工程师直接使用 SQL 定义工作流,并由 PostgreSQL 负责执行和检查点记录,从而确保即使在系统崩溃、重启或单个步骤失败时,任务也能从上次保存的进度无损恢复,无需人工干预。
pg_durable 的核心价值在于架构极简。传统的后台任务通常需要组合 Cron 调度器、消息队列、状态表以及外部编排器(如 Airflow 或 Temporal),而 pg_durable 让这些逻辑回归数据库内部。它采用 SQL 原生的 DSL(领域特定语言)定义函数图,利用 Rust 编写并基于 pgrx 框架运行,无需 Redis 等额外基础设施。
该工具特别适用于构建向量嵌入管道、数据摄取、API 集成及需要容错性的批处理任务。虽然目前处于预览阶段且仅支持 PostgreSQL 17 和 18 版本,但它展示了“计算向数据靠拢”的趋势,为重度依赖 Postgres 的团队提供了一种高效的轻量级工作流解决方案。
对于 AI 和数据处理场景,这一变化具有重要意义。现代 AI 应用(如 RAG 流程)涉及大量的数据清洗、向量化处理和批处理,这些步骤逻辑复杂且极易出错。pg_durable 允许在数据存放地直接定义容错逻辑,避免了在应用层和数据库层之间维护繁琐的状态同步。虽然该方案受限于 SQL 的表达能力,且不适合高并发的即时响应请求,但对于后台作业和 ETL 流程,它提供了一种极具吸引力的“SQLite for orchestrations”式的极简路径。
💡 核心观点:pg_durable 将编排能力下沉至数据库内核,标志着 PostgreSQL 正从单一数据存储向应用运行时演进,极大简化了 AI 与数据处理工程的技术栈。
原文链接:Hacker News
来自 404 Media 的报道揭示了美国军方一项隐秘的科技行动。伦敦大学学院(UCL)信息安全工程教授 Steven Murdoch 经详细研究发现,近二十年来,美军一直在利用公共 GPS 信号广播其全球加密网络的代码。这意味着每一颗 GPS 卫星实际上都变成了一个隐藏的“数字电台”,向全球范围内的设备发送机密信息,而外界对此毫不知情。Murdoch 指出,GPS 数据流中标记为“子帧 4,第 17 页”(Subframe 4, Page 17)的 176 位序列,实际上是五角大楼“空中分发”(OTAD)网络的加密材料。该系统专门用于向军事人员分发加密密钥,以访问军用 GPS 信号。
Murdoch 通过分析自 2007 年以来收集的 GNSS 开源档案数据,捕捉了超过 1200 万次对该序列的观测,识别出了关键重复的“哨兵”模式。证据显示,这种特定的加密模式在 2010 年 2 月首次出现,并在 2011 年 5 月 26 日由 31 颗在轨卫星同时传输,这一时间节点与美军 OTAD 和“空中重新密钥化”(OTAR)系统的部署时间线完美吻合。在此之前,美军必须通过人工现场操作来分发密钥材料,而这一系统允许军事 GPS 接收器通过卫星广播进行远程密钥更新。尽管 2022 年该系统进入了新阶段,但核心发现表明,公共基础设施中可能隐藏着大量未被公众注意到的秘密通信渠道。
💡 核心观点:此发现证实了现代基础设施的“暗物质”属性:国家级密钥分发竟隐匿于全球公开信号流中,揭示了隐蔽通信的高级形态并非隐形,而是伪装。
原文链接:Hacker News
近日,技术社区对于将非 GPT 系列大模型(如 DeepSeek 等)接入 Codex 类编程辅助工具的可行性与实际体验展开了深入讨论。该话题源于开发者尝试通过特定的接口转换层,将原本高度适配 GPT 或 Claude 的编程环境迁移至其他开源或低成本模型。核心争议在于,DeepSeek 等模型在训练阶段主要针对通用的代码补全和常规对话场景进行优化,可能并未专门学习 Codex 环境中特有的“freeform apply_patch”等高级工具调用协议及指令格式。这种底层数据分布的差异,可能导致模型在生成代码补丁或执行特定指令时出现格式偏差,从而无法完美触发 IDE 的自动化修复与应用功能。尽管存在潜在的协议适配风险和不确定性,但出于降低 API 调用成本、确保数据隐私以及探索更强模型推理能力的驱动,大量技术爱好者依然乐此不疲地进行尝试与适配。该讨论折射出当前 AI 编程工具生态中,通用大模型基座与特定垂直应用 Harness 之间尚存的适配隔阂,以及开发者对打破模型生态垄断的强烈诉求。
💡 核心观点:通用模型推理能力的提升虽显著,但对特定工具协议的适配度仍是决定非原生模型能否流畅“平替”的关键瓶颈。
原文链接:Linux.do