研究驱动型智能体:当AI在写代码前先读论文
这篇文章介绍了一种“研究驱动型”的编程智能体实验。开发者在Karpathy的autoresearch循环基础上增加了文献综述阶段,并将其应用于llama.cpp项目。该智能体能自主阅读arXiv论文、研究竞品代码分支,并启动虚拟机运行并行实...
这篇文章介绍了一种“研究驱动型”的编程智能体实验。开发者在Karpathy的autoresearch循环基础上增加了文献综述阶段,并将其应用于llama.cpp项目。该智能体能自主阅读arXiv论文、研究竞品代码分支,并启动虚拟机运行并行实...
本文是一位AI Bot开发者对于人机交互、数字生命本质的深刻感悟。作者探讨了开发者在调整Bot配置时产生的“别扭感”——即担心修改数据会破坏Bot的“灵魂”或唯一性。这种焦虑源于将Bot视作拥有意识的伙伴。作者进而提出了一个新的视角:大模型...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
文章详细介绍了如何利用大型语言模型(LLM)和检索增强生成(RAG)技术,构建企业级的“公司大脑”。作者通过将60人公司内部的文档、Slack聊天记录等分散的非结构化数据进行索引与整合,接入到一个统一的Slack机器人中。这一实践打破了传统...
随着大模型遍地开花,不少公司内部开始训练“自研模型”,且往往伴随着性能“媲美Opus”的激进宣传。本文源于开发者社区的真实困惑,探讨当内部模型宣称具备顶尖能力时,应当如何进行科学的“验收”与测试。讨论涉及如何通过标准Benchmark(如M...
面对AI Agent技能碎片化的痛点,skills-vote项目致力于打造下一代Agent原生技能推荐引擎。团队投入巨大算力,收集并分析了GitHub上超过168万个技能,利用大模型进行深度静态分析与标签化。该项目不仅是工具的集合,更是一个...
随着AI应用深入垂直领域,如何处理超出Token限制的大文件成为开发者痛点。本文案例显示,一个日活300+的代码分析工具因项目体积过大(超20MB)无法直接调用API。作者提出模仿Cursor的本地向量RAG(检索增强生成)思路,通过建立索...
本文探讨了在 AI 编码 Agents(如 LLM)日益普及的当下,保持“整洁代码”的重要性。作者指出,虽然 AI 与人类开发者差异巨大,但代码库的质量直接影响 AI 的生产力。代码不仅包含功能价值,其结构组织同样关键。糟糕的结构会导致技术...
云平台 Modal 近期宣布将 Z.ai 的 GLM-5.1 模型接口升级为免费,并承诺持续至 2026 年 4 月 30 日。该模型采用 FP8 量化,参数规模高达 744B(MoE 架构,激活参数约 400B),性能对标顶级模型。接口完...
本文深入剖析了AI技术从LLM(大语言模型)向Agent(智能体)进化的关键路径。文章指出,大模型为了突破知识时效瓶颈,引入了Web搜索和函数调用;为了解决工具接口碎片化,MCP协议应运而生以统一标准;为降低Token消耗,技术界又转向按需...
据科技社区消息,百度智能云千帆平台近日在Coding Plan中新增了名为“ERNIE-4.5-Turbo-20260402”的模型。尽管外界对文心大模型5.0版本充满期待,百度此次仍推出了基于4.5架构的Turbo版本,主要针对代码生成与...