架构第2页

深入系统设计的底层逻辑。从数据结构到分布式架构，用代码级视角剖析技术本质。B树深度教学、搜索引擎索引、私有化部署方案。

OpenSpec：给 AI 写代码这件事加一层"规格说明书"的逻辑

**什么改变了我的想法？** 以前我认为"规格说明书"这种东西是给大团队、正式项目用的，个人用 AI 写代码根本不需要这套流程。看完这个视频我意识到，恰恰因为 AI 写代码时的"自行补全"倾向太强，你反而更需要一个清晰的规格来约束它，否则它在每个模糊点上替你做决定，最后出来的东西跟你想的差很远。 **如果只记住一件事：

赞(0)

Toy2026-05-28阅读(113)

大型代码库里的 AI，真正先放大的不是写代码，而是“理解代码”

这篇分享最有价值的地方，不是又一次鼓吹 AI 写代码，而是把一个更容易被忽略的事实说透了：在大型代码库里，真正提升产出的常常不是生成能力，而是理解能力。本文整理自 Sentry 工程师 Priscila Andre de Oliveira 在 AI Engineer 活动上的一场分享。她讲的不是“如何用 AI 一把梭

赞(0)

Toy2026-05-28阅读(109)

阿里云全线云产品特惠 · 一站采购

ECS / OSS / CDN / 云数据库一站采购,常用云资源集中选配;新用户与续费均有专场优惠,适合个人开发者与小团队长期使用。

2026-07-29

AI 代理的四种记忆：从上下文窗口到跨会话学习

这期视频表面上在讲 AI agent 的四种记忆，真正有价值的地方是它把今天已经落地的几套工程做法放进了同一张图里：上下文窗口负责眼前，Claude.md 这类项目文档负责常识，skills 负责做事的方法，跨会话记忆才负责真正意义上的“越用越熟”。原视频：https://www.youtube.com/watch?v

赞(0)

Toy2026-05-27阅读(96)

Claude Code 的记忆系统

每次新开一个 Claude Code 会话，上下文窗口是空的。你之前告诉它的事情，它全忘了。这不是 bug，是设计。问题在于，每次重新解释同一套规则，实在太麻烦。 Claude Code 提供了两套机制来解决这个问题：你自己写的 CLAU...

赞(0)

Toy2026-05-26阅读(112)

AI 时代，创业者最大的敌人是快

以前，一个非技术创始人想做一个产品，最少要三件事：找技术联创、融资、等工程师。这个周期动辄半年。现在，他只需要打开 Claude Code，用自然语言描述需求，几天后就有一个能跑的原型。 Anthropic 最近发布了一份创业手册，讲了这个时代创业的新规则。但整份手册里最反直觉的观点不是"AI 让构建变容易了"，而是

赞(0)

Toy2026-05-26阅读(62)

用 Claude 做一个会自己长脑子的知识库：比 Obsidian 插件栈更轻，也更像真正的第二大脑

一期讲 Karpathy 式 LLM Wiki 的视频实操：三个文件夹、一个 Claude MD、按月 health check，让 AI 当知识库管理员，而不是继续让人自己维护插件栈。本文整理自 Systems Made Better 这期视频。它真正有价值的地方，不是再教你做一个更花哨的笔记系统，而是把知识库维

赞(0)

Toy2026-05-25阅读(168)

Agent Harness 是 AI 编程从提示词走向工程系统的一步

过去两年，大家讲 AI 编程，最常见的词是 prompt engineering、context engineering。现在又冒出一个新词：agent harness。词一多，概念就容易乱。Caleb Writes Code 这期 8 分钟短视频，讲的其实不是一个新黑话，而是一个很现实的工程分层：当任务变长、上下文会

赞(0)

Toy2026-05-24阅读(88)

FDE 是谁：AI 落地的最后一公里，由人来扛

最近招聘市场冒出一个被反复提起的岗位——FDE，Forward Deployed Engineer，中文译作”前线部署工程师”或”驻场交付工程师”。Indeed 的数据显示，2025 年前 9...

赞(0)

Toy2026-05-23阅读(470)

Langfuse：AI Agent 时代的可观测基础设施

软件工程里有一个老规律：每当一种新形态的应用大规模出现，先解决”看得见”问题的基础设施就会成为事实标准。Web 时代是 New Relic 和 Datadog，移动时代是 Crashlytics，云原生时代是 Pro...

赞(0)

Toy2026-05-22阅读(149)

Andrej Karpathy 对 agentic engineering 的最新补充

最近关于 AI 编程的讨论，已经从“会不会写代码”转向“怎样把一个不稳定的智能体放进可控的工程系统里”。Karpathy 这场新对谈把 software 3.0、可验证性、jagged intelligence 和 agentic engineering 之间的关系讲得更清楚了。

赞(0)

Toy2026-05-21阅读(137)

Positional Encoding 怎么解决词序问题

Transformer 刚出来时，很多人把注意力都放在 self-attention 上。那当然没错，因为它确实重新定义了模型怎么看上下文。但如果只盯着 attention，你会漏掉另一个同样关键的问题：模型怎么知道词序？这是我看完这期视频后最强烈的感受。Transformer 的突破，不只是让每个词都能看见别的词，

赞(0)

Toy2026-05-19阅读(50)

Self-Attention 为什么成了 Transformer 的核心机制

软件模型有过一个很长的阶段：它们能读句子，却不太会“理解句子”。问题不在词表，也不完全在参数规模，而在于早期模型看待语言的方式太像流水线——前一个词处理完，才能轮到后一个词。这样一来，句子一长，前面的信息就会慢慢变模糊。这就是我看完这期视频后最想记住的一点：Transformer 真正改变局面的地方，不是简单把模型做

赞(0)

Toy2026-05-19阅读(55)

Multi-Head Attention：一句话有歧义怎么办？多看几遍

自然语言天生有歧义。 "The detective followed the spy with binoculars." 这句话有两个完全合理的理解：侦探拿着望远镜跟踪间谍，或者间谍带着望远镜刚好被侦探跟上了。人脑能瞬间意识到两种可能，但早期的 AI 模型做不到——它只会 picks up 其中一种，另一种直接丢掉。

赞(0)

Toy2026-05-19阅读(44)

Harnesses 让 AI Agent 变得可靠

软件开发里，大家最熟悉的词可能还是 agent。但最近两年，另一个词开始频繁冒出来：harness。这个词不好翻。按字面，它是“安全带”或者“束具”。不过放到 AI 工程里，我觉得它更像一层“驯化外壳”——不是替代模型，而是把一个不稳定、不可预测、还经常会撒谎的模型，拴到一个稳定、可验证、可以控的运行环境上。这篇

赞(1)

Toy2026-05-18阅读(140)

Claude Code 的第一条 Prompt，重点从来不是“怎么写一句漂亮的话”

很多人第一次打开 Claude Code，最紧张的地方往往不是功能不会用，而是不知道第一句话该怎么说。这个视频其实很短，讲的也不是复杂技巧，但它点醒了一个很容易被忽略的问题：**Claude Code 的第一条 prompt，重点从来不在“修辞”，重点在你到底有没有把任务边界、风险偏好和执行节奏交代清楚。** 这类入门

赞(0)

Toy2026-05-17阅读(75)

Mythos 不是重点，重点是企业已经开始把 AI 当成真正的劳动力

本文整理自 Nate B Jones 一期关于企业 AI 变化的周观察。它表面上讲的是五条 AI 新闻，真正更值得看的是一个更底层的变化：企业正在把 AI 从聊天工具，改造成能接手真实工作流的执行者。

赞(0)

Toy2026-05-17阅读(80)

真正会被 AI 留在后面的，是把脑子外包出去的人

这篇文章想聊的，是一个越来越不方便直说、但迟早要面对的现实。AI 当然在提高效率，可它也在制造一种很温柔、很隐蔽、很容易被误判成“进步”的退化。被削弱的，不是手速，不是信息量，不是表面产出，受伤最深的是思考、表达、搜索、判断、学习这些原本该越练越强的基本能力。最近几年最流行的一句话之一，是“不会用 AI 的人会被淘汰

赞(0)

Toy2026-05-16阅读(79)

Intercom 把工程吞吐量翻倍之后，我看到的是一整套更清晰的职场规则

本文整理自 AI Engineer 对 Intercom 工程负责人 Brian Scanlan 的分享。文章重点不只放在 Claude Code 和吞吐量翻倍，而是去看更关键的一层：当一家公司把 AI 接进主生产系统后，工程团队的分工、评价标准、平台能力和组织权力会怎样一起被重写。原视频：https://www.youtube.com/watch?v=4_VQBbs2iQA

赞(0)

Toy2026-05-16阅读(104)

Agents 不做站会了：PFF 怎么把工程组织从“帮工程师提速”改成“帮 Agent 提速”

这篇内容最值得看的地方，是它把视角直接抬到了组织层。Mike Spitz 没沿着“工程师配上 AI 之后效率更高”这条熟悉叙事往下讲，他干脆换了问题本身，从“如何让工程师产出更多”切到“如何让 agent 在组织里跑得更快”。问题一换，站会、Sprint Planning、Retrospective、代码评审分工、QA

赞(0)

Toy2026-05-16阅读(81)

Agent Memory 的五种解法：从 1 亿 token 到 Git for Data，2026 年盘点

过去一周，AI Agent 圈一口气出了五个”记忆”相关开源项目。腾讯、盛大、字节、矩阵起源、上海交大联合，都在抢同一个心智位——「让 Agent 不再是金鱼脑」。我把五个项目都摸了一遍，包括论文、第三方解读、工程...

赞(0)

Toy2026-05-15阅读(147)

上一页
1
2
3
4
5
...
下一页
共 7 页

事件分析

随着大模型向MoE（混合专家）架构演进，推理复杂度显著提升，本地部署的算力瓶颈日益凸显。llama.cpp作为目前最主流的本地推理引擎，快速适配并优化GLM-5.2这一先进的国产大模型，体现了开源社区对高效能AI技术的强烈需求。通过引入NextN/MTP推测解码技术，利用模型内部的特定结构（如共享专家和MLA注意力机制）进行预测，能够在不牺牲模型精度的前提下实现20%的性能红利。这意味着个人开发者和小型企业将能够以更低的硬件成本，在本地设备上流畅运行最前沿的超大规模模型，减少对云端API的依赖，推动边缘侧AI应用的进一步普及。

💡 核心观点：llama.cpp对GLM-5.2的底层优化与推测解码支持，有效打破了本地大模型推理的性能瓶颈。

事件分析

该案例体现了 AI 编程工具从单一辅助向多模型协同作业的演进趋势。开发者不再仅依赖单一对话式大模型，而是根据模型的特性（如 Claude 的长上下文与推理能力、ChatGPT 的通用知识广度）进行精细化分工。这种工作流标志着软件开发范式的根本性转变：开发者的核心价值正从代码语法的具体实现，转移至对架构设计的把控与 AI 生成内容的精准审查。随着 AI 工具在代码生成领域的准确率提升，未来软件开发将更加依赖这种“人类指挥+多 AI 执行”的协作模式。这也暗示了单一通用模型可能难以满足专业开发的所有需求，针对特定场景优化的工具链整合将成为提升开发效率的关键。

💡 核心观点：软件开发的「人机协作」已进入深水区，开发者转型为架构指挥官，精细化分工的多模型组合将是未来的主流生产力形态。

事件分析

该观察触及了当前软件工程领域最核心的变革：AI 编程工具的普及正在重塑开发生态。随着 Cursor、Claude Code 等工具的兴起，代码生成的门槛显著降低，初级程序员的生存空间受到挤压，行业对“码农”的需求正向“架构师”或“AI 训练师”转移。这种趋势表明，未来的软件生产将不再受限于人力资源的瓶颈，创意落地的周期被极度压缩。同时，以 Intel 奔腾为代表的传统硬件算力演进路线，在实现“机器思考”这一目标上，已让位于以神经网络为核心的大模型技术。这暗示着科技产业的竞争焦点已从单纯的芯片制程竞赛，转向了算法模型与算力协同的智能化应用落地。

💡 核心观点：硬件未竟的“思考”预言由大模型实现，AI编程的普及让产品定义力取代代码实现力成为核心竞争力。

事件分析

此次巨额融资标志着AI大模型行业的竞争已从单纯的技术迭代转向“资本+算力”的双重军备竞赛。500亿美金的投前估值显示市场对拥有C端爆款应用（如Kimi）的企业给予了极高溢价，认可其用户粘性与数据飞轮效应。在行业普遍关注ROI（投资回报率）的背景下，头部厂商通过Pre-IPO轮融资快速锁定资金，意在通过高强度的算力投入拉开模型能力的代差。这也预示着中国大模型行业的洗牌期加速到来，资金将向具备顶级应用落地能力的头部企业高度集中，中小玩家的生存空间将被进一步压缩。

💡 核心观点：500亿估值将AI大模型军备竞赛推向白热化，资本向头部高度集中的马太效应已成定局。

事件分析

此事件揭示了硅谷在 AI 发展路径上存在的根本性分歧，即“开源优先”与“封闭安全”之争。扎克伯格的言论不仅是地缘政治表态，更是 Meta 针对 OpenAI 和 Anthropic 等竞争对手发起的战略攻势。Meta 试图通过将“封闭模型”定义为“监管俘获”的工具，来拆解竞争对手利用“AI 安全”构建的护城河。从技术安全角度看，扎克伯格提出的“封闭模型导致防御滞后”观点极具讽刺意味，通常封闭模型以安全性为由限制开源，但在实际攻防中，开源生态的快速迭代反而提供了更强的修复能力。这表明，AI 安全的定义权正在成为科技巨头争夺的核心话语权，未来围绕监管主导权的博弈将进一步白热化。

💡 核心观点：扎克伯格借地缘政治抨击 OpenAI，本质是 Meta 试图通过“开源解构主义”打破竞争对手利用监管构建的封闭生态护城河。

事件分析

ChatGPT 虽然即将迈入 10 亿周活用户的“亿级俱乐部”，但增长预期的落空标志着大模型市场已正式告别技术红利期的野蛮生长，转向存量竞争与精耕细作。外部来看，Claude、Gemini 等竞品在模型能力上的快速追赶，证明了技术护城河正在变窄，用户不再对单一品牌具有绝对的忠诚度，而是在不同模型间进行基于实际效果的“用脚投票”。内部来看，GPT-5 未能有效提振增长甚至引发增速下滑，暗示着单纯靠提升模型参数已难以带来用户感知的质变，产品体验、稳定性及垂直场景的落地能力正成为制约发展的新瓶颈。这表明行业焦点已从“模型越大越好”转移至“产品越好用越好”，未来的竞争将更多依赖于 AI Agent 化的应用生态构建及对开发者体验的优化。

💡 核心观点：大模型存量博弈时代开启，单纯的技术代差红利消退，产品体验与生态粘性成为留存用户的关键。

架构第2页

OpenSpec：给 AI 写代码这件事加一层"规格说明书"的逻辑

大型代码库里的 AI，真正先放大的不是写代码，而是“理解代码”

阿里云全线云产品特惠 · 一站采购

AI 代理的四种记忆：从上下文窗口到跨会话学习

Claude Code 的记忆系统

AI 时代，创业者最大的敌人是快

用 Claude 做一个会自己长脑子的知识库：比 Obsidian 插件栈更轻，也更像真正的第二大脑

Agent Harness 是 AI 编程从提示词走向工程系统的一步

FDE 是谁：AI 落地的最后一公里，由人来扛

Langfuse：AI Agent 时代的可观测基础设施

Andrej Karpathy 对 agentic engineering 的最新补充

Positional Encoding 怎么解决词序问题

Self-Attention 为什么成了 Transformer 的核心机制

Multi-Head Attention：一句话有歧义怎么办？多看几遍

Harnesses 让 AI Agent 变得可靠

Claude Code 的第一条 Prompt，重点从来不是“怎么写一句漂亮的话”

Mythos 不是重点，重点是企业已经开始把 AI 当成真正的劳动力

真正会被 AI 留在后面的，是把脑子外包出去的人

Intercom 把工程吞吐量翻倍之后，我看到的是一整套更清晰的职场规则

Agents 不做站会了：PFF 怎么把工程组织从“帮工程师提速”改成“帮 Agent 提速”

Agent Memory 的五种解法：从 1 亿 token 到 Git for Data，2026 年盘点

置顶推荐

前沿哨所

llama.cpp更新：支持GLM-5.2及NextN推测解码，本地推理提速20%

事件分析

一名开发者的多模型实战：如何利用 AI 工具实现 90% 代码生成

事件分析

从“差个程序员”到AI自动生成：大模型如何重塑开发与英特尔“奔腾”预言的实现

事件分析

月之暗面完成超35亿美元F轮融资，估值飙升至350亿美元，Pre-IPO轮提前启动

事件分析

扎克伯格呼吁勿封禁中国 AI 模型，抨击 OpenAI 等“监管俘获”阻碍竞争

事件分析

OpenAI增长不及预期：ChatGPT周活将破10亿但晚了7个月，遭Claude与Gemini分流

事件分析

最新文章

热门专题

热门标签

网站统计

架构 第2页

置顶推荐

前沿哨所

llama.cpp更新：支持GLM-5.2及NextN推测解码，本地推理提速20%

事件分析

一名开发者的多模型实战：如何利用 AI 工具实现 90% 代码生成

事件分析

从“差个程序员”到AI自动生成：大模型如何重塑开发与英特尔“奔腾”预言的实现

事件分析

月之暗面完成超35亿美元F轮融资，估值飙升至350亿美元，Pre-IPO轮提前启动

事件分析

扎克伯格呼吁勿封禁中国 AI 模型，抨击 OpenAI 等“监管俘获”阻碍竞争

事件分析

OpenAI增长不及预期：ChatGPT周活将破10亿但晚了7个月，遭Claude与Gemini分流

事件分析

最新文章

热门专题

热门标签

网站统计

架构第2页