模仿人类查阅模式:用 System Prompt 与 Function Call 重构 AI 知识库检索
该文探讨了一种新颖的 AI 知识库设计思路,主张模仿人类在图书馆查阅资料的思维模式。作者提出,不单纯依赖传统的向量语义检索,而是通过 System Prompt 定义顶层目录结构,结合 Function Call 让 AI 自主调用工具,模...
该文探讨了一种新颖的 AI 知识库设计思路,主张模仿人类在图书馆查阅资料的思维模式。作者提出,不单纯依赖传统的向量语义检索,而是通过 System Prompt 定义顶层目录结构,结合 Function Call 让 AI 自主调用工具,模...
这篇文章是OpenAI前研究科学家、特斯拉前AI总监Andrej Karpathy写于2016年的经典博客,至今仍对科技从业者极具参考价值。Karpathy深入剖析了攻读博士学位的真正意义,指出这并非仅仅为了获得学位,而是为了掌握在没有路标...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
在AI模型聚合平台OpenRouter上,社区发现了一个名为“hunter-alpha”的神秘模型,其规格标注为惊人的1T(万亿)参数量及1M(100万)上下文窗口。目前该模型支持完全免费调用。鉴于DeepSeek近期在技术上的突破性表现及...
Anthropic 宣布 Claude 3 Opus 和 Sonnet 模型的 100 万 token 上下文窗口正式全面可用。此次更新最具爆炸性的点在于定价策略:处理 1M 上下文输入的价格与此前处理 200K 上下文完全相同。这意味着用...
本文深入分析了为何软件开发成为人工智能最先深度介入的行业。作者指出,核心原因并非编程简单,而是因为软件开发具备“可验证、可修复、低风险”三大特性:代码可通过测试自动验证,错误能快速迭代修复,且大多数软件故障不直接威胁生命安全。同时,文章犀利...
V2EX 社区最新推荐的一款基于 GitHub 的开源项目 ccpocket,被用户誉为目前体验最佳的 Claude 和 Codex 移动端客户端。该工具填补了官方移动端体验的短板,为开发者和 AI 爱好者提供了便捷的口袋助手。相比网页版,...
该项目是一款基于大模型(LLM)驱动的 Kubernetes 集群智能诊断 Agent。作者利用 LangGraph 框架构建状态机工作流,使 AI 能够理解自然语言指令并自动执行针对性的故障排查。该工具集成了 Anthropic、Open...
本文详细介绍了一种被称为“vibe writing”的AI辅助学术写作新范式,并推荐了一款名为“viwerleaf”的开源工具。作者在体验了AI从初稿生成、公式推导到配图的全流程后,针对Overleaf编译慢及现有Agent工具门槛高的问题...
近日,字节跳动的豆包大模型凭借其流畅的实时视频对话功能在科技圈引发热议。用户反馈显示,该功能在视觉识别与语音交互的延迟控制上表现卓越,几乎达到了毫秒级的响应速度。这一突破不仅展示了国产大模型在端到端多模态技术上的硬核实力,也引发了业内关于其...
InkOS是一个基于LLM的多Agent流水线小说生产CLI工具。其v0.3版本重构了规则体系,实现了基础护栏、题材特性与单本书规则的三层分离。用户可针对玄幻、都市等题材定制专属的语言铁律与数值体系,并利用19维度审计系统过滤“AI味”和逻...
受社区灵感启发,一位开发者利用AI项目MiroFish对热门社会话题进行了大规模预测实验。面对ZEP官方API的速率与成本瓶颈,作者自主开发了OpenZEP工具,成功接入第三方API Key替代官方接口。这一改进解决了技术限制,使得Miro...
随着 AI 技术的爆发,GitHub 正从传统的代码托管平台迅速演变为全球最大的 AI 研发与分发中心。本文探讨了 GitHub 上 AI 项目数量的激增、微软对 AI 功能的深度整合,以及这一转变对开源生态的深远影响。文章深入分析了开发者...
本文源自 V2EX 社区的技术讨论,聚焦于 AI 在企业环境中的实际应用现状。话题发起者指出,虽然编程是目前公认 AI 提效最显著的领域,但探讨其边界同样重要。内容汇聚了一线科技从业者的真实反馈,触及了办公自动化、文档处理、数据分析等非代码...
在技术社区 Linux.do 上,腾讯推出的 AI 编程助手 WorkBuddy 引起开发者关注。作为对标 GitHub Copilot 的产品,WorkBuddy 基于腾讯混元大模型,旨在提供代码补全、生成及优化等功能。社区讨论主要集中在...
开发者发布开源项目PaperSpark,旨在解决研究生科研中工具割裂的痛点。该项目集成了论文搜索(多智能体系统编排OpenAlex)、深度精读(OCR解析、RAG检索、知识图谱构建)与沉浸式写作(类Notion体验、Tab键AI补全、Zot...
本文深入探讨了Kovan技术,这是一项旨在解决高并发环境下内存回收难题的创新方案。文章回顾了多版本并发控制(MVCC)系统的演进历程,指出了传统基于锁的回收算法在延迟与吞吐量上的局限性。Kovan提出了一种全新的无等待内存回收机制,能够在不...
Reddit用户通过深挖IRS税务申报、参议院游说披露及竞选财务记录,揭露了推动美国多州“年龄验证”立法浪潮的幕后真相。调查发现,这并非单纯为了保护未成年人,而是一场由特定公司主导的“影响力行动”。其真正意图是在操作系统层面构建强制性的监控...
近日有用户发现,Google Gemini 模型开始出现与 ChatGPT 极为相似的行为怪癖,例如在评估文本时不请自来地加上“Take a deep breath”(深呼吸)等前缀。虽然用户指出 Gemini 在指令遵循和可控性上目前仍优...
清华大学与智谱研究团队联合推出名为IndexCache的创新技术,旨在突破大语言模型在处理长文本任务时的效率瓶颈。该技术聚焦于稀疏注意力机制,通过在不同模型层之间实现“跨层索引复用”,在几乎不牺牲模型性能的前提下,显著降低了索引计算开销。实...
据微信公众号“白鲸实验室”爆料及Linux.do社区讨论,DeepSeek V4模型或将于今年4月正式上线。针对该消息,社区反应两极,部分网友因频繁的“狼来了”式消息而感到麻木。此外,传闻还提及腾讯混元大模型也将推出更新。DeepSeek近...