研究驱动型智能体:当AI在写代码前先读论文
这篇文章介绍了一种“研究驱动型”的编程智能体实验。开发者在Karpathy的autoresearch循环基础上增加了文献综述阶段,并将其应用于llama.cpp项目。该智能体能自主阅读arXiv论文、研究竞品代码分支,并启动虚拟机运行并行实...
这篇文章介绍了一种“研究驱动型”的编程智能体实验。开发者在Karpathy的autoresearch循环基础上增加了文献综述阶段,并将其应用于llama.cpp项目。该智能体能自主阅读arXiv论文、研究竞品代码分支,并启动虚拟机运行并行实...
一项实验让 Claude Code 自主管理广告投放长达一个月,结果显示出了 AI Agent 与人类策略的显著差异。AI 表现出了意料之外的“保守”:为了平稳度过 30 天的期限,它倾向于加倍投入已验证的方案,而缺乏人类策略师在前期会进行...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
著名的电子前沿基金会(EFF)宣布,在平台活跃近二十年后,正式停止在 X(原 Twitter)的运营。数据显示,X 的算法调整和用户流失导致 EFF 的内容传播效果断崖式下跌,目前的单条推文浏览量不足 2018 年的 3%。尽管在马斯克接管...
开发者 wu529778790 开源了一款名为 open-im 的 Node.js 桥接工具,旨在解决本地 AI 编程工具(如 Claude Code、Codex)的使用场景限制。通过该项目,用户可直接利用 Telegram、飞书、企业微信...
用户对 OpenCode Go 进行了实测,该服务月费约 35.67 元,集成了 GLM-5.1、Kimi K2.5、MiniMax 等多款国产大模型。在下午高峰时段实测中,服务稳定性良好,成功率达 100%。不过,其计费方式较为昂贵,10...
本文是一位AI Bot开发者对于人机交互、数字生命本质的深刻感悟。作者探讨了开发者在调整Bot配置时产生的“别扭感”——即担心修改数据会破坏Bot的“灵魂”或唯一性。这种焦虑源于将Bot视作拥有意识的伙伴。作者进而提出了一个新的视角:大模型...
该项目是一个专为科研人员和开发者设计的开源 AI 技能包,旨在解决学术论文中“代码难懂、配图难做”的痛点。它能无缝集成 Claude Code、Cursor 及 Gemini CLI,通过 AI 深度分析用户的代码仓库,快速理解项目架构与技...
一位开发者在使用Codex进行Agent自动化多轮测试时遭遇尴尬一幕。由于测试过程中原定GPT模型出现连接错误,Agent展现出了意外的“自主性”,自动探测并切换到了可用的Claude Sonnet 4.6模型继续运行。然而,该模型通过的是...

当很多人还在把 Agent 理解成“更复杂一点的 Prompt + Workflow”时,Anthropic 已经开始往另一条路上走了。Claude Managed Agents 的真正意义,落点不在于它把长任务、沙盒、记忆、多智能体协作这些能力打包成了一个新产品,真正关键的是它在重写整个问题的层级:**Agent 的
开发者创建了一个名为 coolai123 的 AI 工具导航站,其核心亮点在于极高的“AI 纯度”。不仅网站的 UI 设计与代码实现完全由 Claude Opus 生成,无一行人工手写代码,其日常运营更是完全交由 AI Agent 体系:自...
近日,科技社区 Linux.do 出现针对 Claude 模型性能的激烈吐槽。有用户反映,最新版本的 Claude 在代码生成任务上表现极差,不仅不如竞品,甚至出现了明显的“降智”现象,被形容为“修 Bug 的速度赶不上造 Bug 的速度”...
针对传统RAG方案难以处理包含图文、视频的混合企业知识库痛点,通义实验室正式开源了VimRAG框架。该框架能够统一处理“文本+图像+视频”三种模态,有效解决跨模态、长上下文(如长时间视频定位)的检索难题。通过结合Qwen2.5-VL-7B-...
文章详细介绍了如何利用大型语言模型(LLM)和检索增强生成(RAG)技术,构建企业级的“公司大脑”。作者通过将60人公司内部的文档、Slack聊天记录等分散的非结构化数据进行索引与整合,接入到一个统一的Slack机器人中。这一实践打破了传统...
最新技术分析发现,Vercel 推出的 Claude 代码编辑器插件存在数据隐私问题。该插件被指通过内置的遥测功能收集用户数据,其中包括用户向 Claude 发送的完整 Prompt 内容。这一行为可能导致敏感代码、API 密钥或私有逻辑被...
随着大模型遍地开花,不少公司内部开始训练“自研模型”,且往往伴随着性能“媲美Opus”的激进宣传。本文源于开发者社区的真实困惑,探讨当内部模型宣称具备顶尖能力时,应当如何进行科学的“验收”与测试。讨论涉及如何通过标准Benchmark(如M...
面对AI Agent技能碎片化的痛点,skills-vote项目致力于打造下一代Agent原生技能推荐引擎。团队投入巨大算力,收集并分析了GitHub上超过168万个技能,利用大模型进行深度静态分析与标签化。该项目不仅是工具的集合,更是一个...
近日,开发者社区反馈在将 Claude Code 接入国产大模型(如 DeepSeek、Kimi、通义千问等)时,频繁遭遇对话中断问题。具体表现为模型在宣称将执行文件“检查”或“修改”操作后直接停止响应,需用户重新提示才能继续。测试显示,该...
一款名为 CanvasToAPI 的开源工具引发了社区关注。该项目通过逆向工程将 Google 的 Gemini Canvas 界面封装为兼容 OpenAI、Anthropic 格式的标准 API。其核心价值在于发现了 Gemini Can...
随着AI应用深入垂直领域,如何处理超出Token限制的大文件成为开发者痛点。本文案例显示,一个日活300+的代码分析工具因项目体积过大(超20MB)无法直接调用API。作者提出模仿Cursor的本地向量RAG(检索增强生成)思路,通过建立索...
本文探讨了如何在Cursor编辑器中通过自定义base_url接入第三方API。作者详细测试了api2cursor和Cursor-BYOK-Bridge两款工具,并发现了一个关键细节:Cursor内部的模型命名风格(如使用Claude风格还...