QMD:面向AI代理的本地混合搜索引擎,支持Claude深度集成
QMD 是一款专为 AI 代理设计的本地 Markdown 搜索引擎,完美结合了 BM25 全文搜索、向量语义搜索及 LLM 重排序技术。该工具完全在本地运行,确保数据隐私,支持对笔记、会议记录及文档进行高效索引与检索。它兼容 Model ...
QMD 是一款专为 AI 代理设计的本地 Markdown 搜索引擎,完美结合了 BM25 全文搜索、向量语义搜索及 LLM 重排序技术。该工具完全在本地运行,确保数据隐私,支持对笔记、会议记录及文档进行高效索引与检索。它兼容 Model ...
本课程深入探讨了RAG与Agent技术在大模型应用中的性能调优实战。内容涵盖多源文档解析、精准切片策略、混合检索架构设计以及HNSW参数调优等核心技术。针对幻觉抑制、领域术语混淆及资源限制下的微调等痛点,提供了事实验证链、LoRA适配等解决...
一款名为do-write的开源AI小说创作平台引发关注,开发者在离职期间基于Spring AI技术栈构建。该平台利用RAG(检索增强生成)技术和ChromaDB向量数据库,实现了从世界观构建、角色设计到智能章节生成的完整写作流程,有效保证了...
本文探讨了在 AI 搜索和 RAG 系统中,仅依赖向量 Embeddings 进行检索的局限性。作者通过实际案例展示了,当停止单纯信任 Embeddings 并引入混合检索或重排序机制后,系统准确率从惊人的 1% 飙升至 67%。文章深入分...
本文深入探讨了基于嵌入模型的代码库索引技术。文章回顾了从传统grep到神经代码搜索的演变,详细解析了CodeBERT、StarCoder及OpenAI等模型的数学原理与架构。同时,介绍了基于AST的结构化代码切片技术,以及HNSW和量化等向...
DeepSeek官网的联网搜索功能表现卓越,能高效检索50+网页内容,回答复杂问题时形成小型DeepResearch。与开源方案相比,商业组合如SERP+JINA/Firecrawl成本高昂,推测DeepSeek内部采用自定义搜索接口、爬虫...
一位Go开发者因公司安排转写C++,现计划转回Go,并设计一个结合AI和RAG的餐厅推荐项目。项目利用用户位置和偏好,通过向量知识库提供个性化推荐。作者还讨论了简历优化挑战,如突出项目难点和影响,并寻求社区建议。文章反映了AI在Go开发中的...

TL;DR LLM的知识有截止日期,RAG让它能查最新资料;LLM只会聊天,Agent让它能干活。RAG的核心是检索+生成,文档分块策略直接影响效果;Agent的核心是感知+规划+记忆+工具,ReAct架构让它能像人一样思考和行动。本文从8...

大模型面试100问:从基础到实战的完整指南 为什么需要这个系列? 大模型面试不是背八股文——面试官要的是系统性理解和实战经验。市面上的面试题要么太碎片化(100个孤立问题),要么太理论化(只讲公式不讲应用)。 这个系列不一样: ✅ 系统化:...
公司计划搭建内网RAG知识库和Agent平台,采用QWEN大模型接口,结合OUTLINE团队协作工具、FASTGPT平台进行知识管理,使用本地m3e和bge rerank模型,通过N8N定期推送知识,利用NGINX实现文档问答弹窗。方案无需...

RAG技术深度解析:让AI不再胡说八道 一、问题 大模型的三大痛点: – 幻觉:一本正经胡说八道 – 知识过时:训练数据截止2023年 – 成本高:微调模型动辄百万美元 核心疑问:如何让AI既便宜又准确?...

AI工程师转型路径:从零到生产级部署 一、问题 传统工程师的困境: – 会写代码,但不懂Transformer – 会调API,但不懂模型原理 – 会用ChatGPT,但不会训练模型 核心疑问:如何从传统...
在人工智能快速发展的今天,系统学习AI知识变得尤为重要。本文针对初学者,详细介绍了从基础到进阶的学习路径,涵盖智能体(Agent)的设计与实现、提示词工程的应用、检索增强生成(RAG)技术等关键领域。文章对比分析了LangChain和Sem...
作者为完善RAG(检索增强生成)教程,计划新增多模态年报检索或文档规范审查项目实战,现公开征集技术建议和改进意见。教程基于GitHub开源项目(https://github.com/datawhalechina/all-in-rag),社区...
本教程为2025年最新版大模型RAG实战课程,共包含39个视频文件,系统讲解RAG工作原理、向量存储与检索、数据库使用、文本分割、检索排序、混合检索、GraphRAG等核心技术。从基础入门到高级进阶,覆盖企业级业务场景落地方案,适合AI开发...
AI novel writing plugin development integrating RAG and Agent technologies, with practical testing on fan fiction.
作者基于飞速markdown项目开发小说撰写插件,采用AI引擎的结构化记忆和RAG技术,提供全面上下文信息。最新版本引入Agent的plan模式,自带审计功能,显著提升生成质量。同时创作同人小说《行尸走肉渡鸦纪元》进行实际测试,已更新至第五...
UltimateRAG: A 5-stage roadmap from demo to enterprise-grade RAG system, addressing core challenges in AI applications.
Sei AI是一家YC W22批次的AI金融科技初创公司,正在招聘中高级LLM工程师。该公司为金融机构提供AI代理平台,已在美国、欧洲和亚太地区的大型企业中落地,月增长率达到两位数。创始人团队拥有超过20年的金融科技和科技产品开发经验,曾在...
Best local RAG systems for Windows with Ollama support. Tested solutions and community insights for privacy-focused AI deployment.
最新评论
这篇文章写得太实用了!按照步骤一步步来,真的能从小白搭建起一个仿小红书的小程序。Cursor的AI补全功能确实大大提高了开发效率,感谢分享!
对比得很清晰。个人觉得如果只是日常聊天和简单任务,Claude 4.5的性价比更高;但如果是复杂的编程任务,GPT-5.2还是更稳定一些。希望能看到更多关于具体使用场景的对比。
开源项目的安全确实容易被忽视。这个案例提醒我们,即使是小功能也要做好权限校验。建议作者可以补充一下修复后的代码实现,让读者更清楚如何防范此类问题。
这个案例太典型了。配置错误导致的故障往往最难排查,因为看起来一切都正常。我们在生产环境也遇到过类似问题,后来引入了配置审查机制才好转。建议大家都重视配置管理!
很棒的漏洞分析!这种小号入侵的问题确实很容易被忽略。建议项目方可以增加一些风控规则,比如检测同一IP的多次注册行为。感谢分享这个案例!
FreeBSD的jail机制确实很强大,能把服务隔离得很干净。不过配置起来确实有点复杂,这篇文章把步骤写得很详细,准备按照教程试试!
实测下来确实如文章所说,规划能力有提升但偶尔会抽风。天气卡片那个案例很有意思,说明模型在理解上下文时还是会踩坑。希望后续版本能更稳定一些。
论文筛选真的是科研人员的痛点,每天arxiv上那么多新论文,手动看根本看不过来。这个工具如果能准确筛选出相关论文,能节省不少时间。感谢开源!