 

共 24 篇文章

标签：rag

QMD：面向AI代理的本地混合搜索引擎，支持Claude深度集成

QMD 是一款专为 AI 代理设计的本地 Markdown 搜索引擎，完美结合了 BM25 全文搜索、向量语义搜索及 LLM 重排序技术。该工具完全在本地运行，确保数据隐私，支持对笔记、会议记录及文档进行高效索引与检索。它兼容 Model ...

Toy2026-01-27前沿阅读(1)去评论

大模型实战必修课：RAG与Agent性能调优50讲全解析

本课程深入探讨了RAG与Agent技术在大模型应用中的性能调优实战。内容涵盖多源文档解析、精准切片策略、混合检索架构设计以及HNSW参数调优等核心技术。针对幻觉抑制、领域术语混淆及资源限制下的微调等痛点，提供了事实验证链、LoRA适配等解决...

Toy2026-01-19前沿阅读(24)去评论

开源AI写作平台do-write：集成Spring AI与RAG技术辅助创作

一款名为do-write的开源AI小说创作平台引发关注，开发者在离职期间基于Spring AI技术栈构建。该平台利用RAG（检索增强生成）技术和ChromaDB向量数据库，实现了从世界观构建、角色设计到智能章节生成的完整写作流程，有效保证了...

Toy2026-01-13前沿阅读(37)去评论

抛弃单纯 Embeddings：准确率从 1% 飙升至 67% 的技术启示

本文探讨了在 AI 搜索和 RAG 系统中，仅依赖向量 Embeddings 进行检索的局限性。作者通过实际案例展示了，当停止单纯信任 Embeddings 并引入混合检索或重排序机制后，系统准确率从惊人的 1% 飙升至 67%。文章深入分...

Toy2026-01-12前沿阅读(29)去评论

深度解析：AI代码搜索的原理与RAG优化策略

本文深入探讨了基于嵌入模型的代码库索引技术。文章回顾了从传统grep到神经代码搜索的演变，详细解析了CodeBERT、StarCoder及OpenAI等模型的数学原理与架构。同时，介绍了基于AST的结构化代码切片技术，以及HNSW和量化等向...

Toy2026-01-11前沿阅读(31)去评论

DeepSeek联网搜索：Agent系统实现揭秘

DeepSeek官网的联网搜索功能表现卓越，能高效检索50+网页内容，回答复杂问题时形成小型DeepResearch。与开源方案相比，商业组合如SERP+JINA/Firecrawl成本高昂，推测DeepSeek内部采用自定义搜索接口、爬虫...

Toy2026-01-06前沿阅读(53)去评论

Go开发者AI项目：位置推荐餐厅，丰富简历

一位Go开发者因公司安排转写C++，现计划转回Go，并设计一个结合AI和RAG的餐厅推荐项目。项目利用用户位置和偏好，通过向量知识库提供个性化推荐。作者还讨论了简历优化挑战，如突出项目难点和影响，并寻求社区建议。文章反映了AI在Go开发中的...

Toy2026-01-06前沿阅读(27)去评论

大模型面试100问05：RAG与Agent篇-Toy's Tech Notes

大模型面试100问05：RAG与Agent篇

TL;DR LLM的知识有截止日期，RAG让它能查最新资料；LLM只会聊天，Agent让它能干活。RAG的核心是检索+生成，文档分块策略直接影响效果；Agent的核心是感知+规划+记忆+工具，ReAct架构让它能像人一样思考和行动。本文从8...

Toy2026-01-04AI 阅读(83)去评论

大模型面试100问：从基础到实战的完整指南-Toy's Tech Notes

大模型面试100问：从基础到实战的完整指南

大模型面试100问：从基础到实战的完整指南为什么需要这个系列？大模型面试不是背八股文——面试官要的是系统性理解和实战经验。市面上的面试题要么太碎片化（100个孤立问题），要么太理论化（只讲公式不讲应用）。这个系列不一样： ✅ 系统化：...

Toy2026-01-04AI 阅读(118)去评论

企业自建内网RAG与Agent平台方案分享

公司计划搭建内网RAG知识库和Agent平台，采用QWEN大模型接口，结合OUTLINE团队协作工具、FASTGPT平台进行知识管理，使用本地m3e和bge rerank模型，通过N8N定期推送知识，利用NGINX实现文档问答弹窗。方案无需...

Toy2025-12-31前沿阅读(39)去评论

RAG技术深度解析：让AI不再胡说八道-Toy's Tech Notes

RAG技术深度解析：让AI不再胡说八道

RAG技术深度解析：让AI不再胡说八道一、问题大模型的三大痛点： – 幻觉：一本正经胡说八道 – 知识过时：训练数据截止2023年 – 成本高：微调模型动辄百万美元核心疑问：如何让AI既便宜又准确?...

Toy2025-12-26实战阅读(52)去评论

AI工程师转型路径：从零到生产级部署-Toy's Tech Notes

AI工程师转型路径：从零到生产级部署

AI工程师转型路径：从零到生产级部署一、问题传统工程师的困境： – 会写代码,但不懂Transformer – 会调API,但不懂模型原理 – 会用ChatGPT,但不会训练模型核心疑问：如何从传统...

Toy2025-12-26实战阅读(57)去评论

系统学习AI：从Agent到RAG的完整指南

在人工智能快速发展的今天，系统学习AI知识变得尤为重要。本文针对初学者，详细介绍了从基础到进阶的学习路径，涵盖智能体（Agent）的设计与实现、提示词工程的应用、检索增强生成（RAG）技术等关键领域。文章对比分析了LangChain和Sem...

Toy2025-12-25前沿阅读(45)去评论

AI RAG教程升级：多模态年报检索项目意见征集

作者为完善RAG（检索增强生成）教程，计划新增多模态年报检索或文档规范审查项目实战，现公开征集技术建议和改进意见。教程基于GitHub开源项目（https://github.com/datawhalechina/all-in-rag），社区...

Toy2025-12-23前沿阅读(44)去评论

2025大模型RAG实战教程：从入门到精通

本教程为2025年最新版大模型RAG实战课程，共包含39个视频文件，系统讲解RAG工作原理、向量存储与检索、数据库使用、文本分割、检索排序、混合检索、GraphRAG等核心技术。从基础入门到高级进阶，覆盖企业级业务场景落地方案，适合AI开发...

Toy2025-12-23前沿阅读(43)去评论

AI Novel Writing Plugin Development: Integrating RAG and Agent Technologies

AI novel writing plugin development integrating RAG and Agent technologies, with practical testing on fan fiction.

Toy2025-12-18前沿阅读(51)去评论

AI小说撰写插件开发：融合RAG与Agent技术

作者基于飞速markdown项目开发小说撰写插件，采用AI引擎的结构化记忆和RAG技术，提供全面上下文信息。最新版本引入Agent的plan模式，自带审计功能，显著提升生成质量。同时创作同人小说《行尸走肉渡鸦纪元》进行实际测试，已更新至第五...

Toy2025-12-18前沿阅读(57)去评论

UltimateRAG: A 5-Stage Evolution Roadmap from Demo to Enterprise-Grade RAG

UltimateRAG: A 5-stage roadmap from demo to enterprise-grade RAG system, addressing core challenges in AI applications.

Toy2025-12-17前沿阅读(58)去评论

YC背景AI金融科技公司Sei招聘LLM工程师

Sei AI是一家YC W22批次的AI金融科技初创公司，正在招聘中高级LLM工程师。该公司为金融机构提供AI代理平台，已在美国、欧洲和亚太地区的大型企业中落地，月增长率达到两位数。创始人团队拥有超过20年的金融科技和科技产品开发经验，曾在...

Toy2025-12-17前沿阅读(57)去评论

Best Local RAG Projects for Windows: Ollama-Compatible Recommendations

Best local RAG systems for Windows with Ollama support. Tested solutions and community insights for privacy-focused AI deployment.

Toy2025-12-17前沿阅读(63)去评论

1
2
下一页
共 2 页

前沿哨所

Gemini Flash在俄罗斯方块基准测试中击败Claude 3 Opus

TetrisBench是一个新兴的AI模型基准测试平台，通过俄罗斯方块对战来评估AI的实时决策与空间推理能力。最新测试结果显示令人惊讶的数据：谷歌推出的轻量级模型Gemini Flash，在与Anthropic顶级旗舰模型Claude 3 Opus的对决中，取得了66%的胜率。这一结果不仅展示了Gemini Flash在游戏策略上的高效能，也引发了业界关于模型规模与特定任务性能之间关系的深入思考。

原文链接：Hacker News

56分钟前
英国上议院通过提案，拟全面禁止未成年人使用VPN

英国上议院近日投票通过修正案，拟禁止向18岁以下人群提供VPN服务，旨在防止未成年人绕过《网络安全法》的年龄验证机制。尽管该提案获保守党支持，但因遭工党政府反对，其最终立法前景不明朗。批评者指出，此举不仅技术实施难度大，还可能损害VPN在数据安全和企业隐私保护中的合法用途。

原文链接：Hacker News

2小时前
AI量化分析显示Chess960开局复杂性差异巨大，传统布局并非最优

该研究利用Stockfish引擎和复杂性科学方法，深入分析了Chess960所有960种起始位置的策略深度。数据显示，白方普遍拥有约0.30兵的先手优势，且不同布局间的决策难度差异高达三倍。值得注意的是，标准国际象棋的起始布局虽具备典型复杂性，但在决策不对称性上处于91百分位，意味着它并不公平。研究指出存在比传统布局更平衡的配置，表明经过数百年文化选择的标准开局并非数学上的最优解。

原文链接：Hacker News

2小时前
谷歌搜索大调整，Google Books 疑遭全面“封杀”

近期，谷歌的一次搜索算法更新引发了广泛关注，导致Google Books的功能实际上已名存实亡。用户反馈称，在谷歌常规搜索中已无法再检索到Google Books的相关书籍内容或预览，这对于依赖该平台查阅文献和资料的群体造成了巨大影响。这一变动不仅引发了关于谷歌是否为了推广AI摘要而牺牲传统搜索工具的质疑，也让人们担忧全球数字化知识库的访问便利性正在倒退。

原文链接：Hacker News

2小时前
AI代码审查泡沫隐现：独立与自主代理才是未来

目前AI代码审查领域竞争激烈，如同曾经的硬苏打水热潮。作者认为，单纯比拼抓Bug能力已难以形成差异化。真正的未来在于构建独立、自主且具备反馈循环的生态系统：编写代码的代理不应同时负责审查，未来的软件开发将实现从编码到验收的全流程无人化闭环。

原文链接：Hacker News

2小时前
重大突破：Fedora Asahi Remix 成功适配苹果 M3 芯片

开源社区迎来重要里程碑，Fedora Asahi Remix 项目宣布已成功在苹果最新的 M3 芯片上运行 Linux KDE Plasma 桌面环境。这意味着开发者突破了苹果芯片的底层限制，为在 M3 设备上运行非 macOS 操作系统扫清了关键障碍。该更新得益于核心贡献者的努力，标志着 Asahi 项目对 Apple Silicon 的支持已扩展至最新一代硬件。

原文链接：Hacker News

2小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始