实测AI自动科研:让Claude通宵跑实验,性能提升54%但架构创新乏力
作者复现了Andrej Karpathy提出的“AutoResearch”概念,通过Claude Code Agent对自己旧有的研究代码进行自动化迭代优化。实验设定了一个闭环流程:Agent根据评估指标反复修改代码、训练并提交结果。在42...
作者复现了Andrej Karpathy提出的“AutoResearch”概念,通过Claude Code Agent对自己旧有的研究代码进行自动化迭代优化。实验设定了一个闭环流程:Agent根据评估指标反复修改代码、训练并提交结果。在42...
本文基于 OpenClaw 源码深入剖析了导致 AI Agent Token 消耗过高的两大核心环节:Skills 调用与 Project Context 加载。作者指出,通过精简技能描述、利用上下文“掐头留尾”的截断特性以及合理配置文件加...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
开发者利用最新的AI编程能力,推出了开源项目“Ai道士”。该项目通过精细的提示词工程,让大模型模拟传统命理学进行八字排盘与大运流年测算。系统支持生成直观的运势走势图,并提供毒舌、甜嘴等多种趣味交互模式。虽然作者坦言项目本身无技术壁垒,但生动...
Memento-Skills 是一个开源框架,提出了“部署时学习”的AI进化新范式。不同于传统的预训练或微调,该框架冻结模型参数,将Agent能力封装为外部Skill文件。通过“读取-执行-反思-写回”的闭环机制,Agent能从失败中自主学...
一位资深AI用户因现有大模型缺乏持久记忆,尝试自建类似钢铁侠“贾维斯”的系统。该方案设想通过iCloud同步短期与长期记忆文件,实现对话后的自动总结与记忆更新,从而解决AI换设备即“失忆”的痛点。但在实际落地中,该用户发现Claude Co...
一位开发者在 V2EX 分享了利用 Claude 大模型开发软考(计算机技术与软件专业技术资格)刷题助手的经历。据描述,该项目完全未手写一行代码,仅通过与大模型的对话交互,耗时 3 小时并消耗少量 API Token 便完成了从构思到 Gi...
随着 AI Coding 和智能体开发的普及,Prompt 的复用难、维护难成为开发者痛点。Anthropic 虽然提出了 SKILL 机制来标准化能力单元,但目前主要局限于 Claude 生态。针对这一现状,作者开源了 SKILL-ada...
近日,一位开发者宣布其自主研发的本地AI知识库项目即将开源。该项目旨在打破本地AI部署的算力壁垒,成功验证了在Ollama框架下运行通义千问(Qwen)3.5的0.8B小参数模型及配套0.6B Embedding模型的可行性。实测表明,即使...
随着AI行业热点转向Agent(智能体)应用,OpenAI的o1系列模型因其卓越的数学逻辑推理与代码生成能力备受瞩目。社区讨论显示,尽管业界涌现出众多国产大模型(如K2.5、GLM5等),但在数学及逻辑能力上似乎出现了退化迹象,难以企及o1...
一款名为“Caption-Trans”的开源工具引发关注,它专为日语视频优化,实现了从字幕提取到大模型翻译的全流程自动化。该工具基于WhisperX技术,利用词级时间戳显著提升了日语转录的准确度,并支持Windows及macOS M芯片的G...