AI编程 · 架构思考 · 技术人生

AI情报局

追踪AI行业一线情报。每周大模型周刊汇总Claude、GPT、Gemini最新动态,深度解读红杉AI峰会、玛丽米克尔报告等行业风向标。RAG技术解析、AI推理边界探索、智谱Coding Plan实测,帮你过滤噪音直击核心。
大模型面试100问08:开源生态篇-Toy's Tech Notes

大模型面试100问08:开源生态篇

TL;DR 开源大模型已经追上闭源——LLaMA 3.1 405B在多项任务上接近GPT-4,Qwen 2.5在中文理解上超越GPT-4o。选模型不是看参数大小,而是看任务适配:LLaMA生态最丰富、Mistral推理最快、Qwen中文最强...

赞(0)ToyToy阅读(27)去评论
大模型面试100问07:特殊架构篇-Toy's Tech Notes

大模型面试100问07:特殊架构篇

TL;DR 稠密模型的参数规模竞赛已经到头,MoE用稀疏激活让470亿参数的模型跑出130亿的速度;多模态让LLM能看图说话,GPT-4V的视觉编码器是关键;Diffusion模型让AI能画画,DDPM和DDIM是两条技术路线。本文从6个高...

赞(0)ToyToy阅读(20)去评论
大模型面试100问06:评估与安全篇-Toy's Tech Notes

大模型面试100问06:评估与安全篇

TL;DR 评估和安全是LLM落地的两大关键——不能衡量就无法改进,不能保护就不敢上线。BLEU/ROUGE适合机器翻译但不适合开放生成,困惑度只能评估语言建模能力;幻觉检测用语义熵,偏见测量用CrowS-Pairs;红队测试模拟攻击,差分...

赞(0)ToyToy阅读(27)去评论
大模型面试100问05:RAG与Agent篇-Toy's Tech Notes

大模型面试100问05:RAG与Agent篇

TL;DR LLM的知识有截止日期,RAG让它能查最新资料;LLM只会聊天,Agent让它能干活。RAG的核心是检索+生成,文档分块策略直接影响效果;Agent的核心是感知+规划+记忆+工具,ReAct架构让它能像人一样思考和行动。本文从8...

赞(0)ToyToy阅读(35)去评论
大模型面试100问04:Prompt工程篇-Toy's Tech Notes

大模型面试100问04:Prompt工程篇

TL;DR Prompt工程是让LLM听懂人话的艺术——同样的问题,换个问法效果天差地别。”让我们一步步思考”这句话为什么能让GPT-4准确率从17%提升到79%?Tree of Thoughts如何让模型像下棋一样...

赞(0)ToyToy阅读(26)去评论
大模型面试100问03:推理与部署篇-Toy's Tech Notes

大模型面试100问03:推理与部署篇

TL;DR 推理才是大模型的真正战场——训练一次,推理百万次。标准Attention的内存带宽成为瓶颈,Flash Attention通过Tiling技术让速度提升5倍;KV Cache让解码快10倍,但长上下文会吃掉几十GB显存;vLLM...

赞(0)ToyToy阅读(30)去评论

十年稳如初 — LocVPS,用时间证明实力

10+ 年老牌云主机服务商,全球机房覆盖,性能稳定、价格厚道。

老品牌,更懂稳定的价值你的第一台云服务器,从 LocVPS 开始