AI编程 · 架构思考 · 技术人生
共 143 篇文章

标签:大语言模型 第5页

2025年AI技术反思:扩散模型与安全挑战

本文探讨了2025年底人工智能技术的发展现状与未来方向,重点讨论了扩散模型与大型语言模型(LLM)的融合应用。文章深入分析了AI优化过程中可能出现的Goodhart定律效应,即过度优化单一指标可能导致系统整体性能下降。特别值得关注的是,文章...

赞(0)ToyToy前沿 阅读(40)去评论

NOAA推出AI驱动全球天气新模型

美国国家海洋和大气管理局(NOAA)近日部署了新一代由人工智能驱动的全球天气模型,标志着AI技术在气象预报领域的重大突破。该模型基于谷歌DeepMind的GraphCast技术(2023年版本),而非近期备受关注的WeatherNext 2...

赞(0)ToyToy前沿 阅读(37)去评论

ClaudeInChrome与Claude Code联动指南

本文深入探讨如何通过ClaudeInChrome插件实现与Claude Code的协同工作,以增强开发过程中的信息感知、错误检测和状态监控能力。用户询问了版本兼容性要求,并分享了哈雷佬魔改版Claude for Chrome ++的实践经验...

赞(0)ToyToy前沿 阅读(43)去评论

AI创意互动:致2026年的一封信

年末将至,一种有趣的AI互动方式在科技爱好者中流传:让主力AI为你写一封致2026年的信。这个简单的提示词不仅能测试AI的语言理解和创造力,还能让我们思考AI如何理解时间、未来和人类情感。只需输入’2025年要过去了,就要202...

赞(0)ToyToy前沿 阅读(35)去评论

提示缓存:LLM成本降低10倍的技术解析

提示缓存(Prompt caching)是一项革命性的AI优化技术,通过智能缓存和重用重复使用的提示内容,显著降低大语言模型(LLM)的token成本,实现高达10倍的节省。本文深入剖析其工作原理,包括如何识别、存储和复用提示片段,减少冗余...

赞(0)ToyToy前沿 阅读(37)去评论

AI论文代码生成系统LunwenToCode发布

LunwenToCode是一个基于大语言模型的智能代码生成系统,专门将科研论文或毕业论文自动转换为可运行的Python代码。系统采用多Agent协作架构,通过分析论文内容、识别研究方法、提取代码需求,最终生成完整Python项目。支持的论文...

赞(0)ToyToy前沿 阅读(43)去评论

历史文本训练的LLMs项目

本项目专注于在1913年之前的文本上训练大型语言模型(LLMs),旨在创建尽可能大的历史LLMs。项目提供信息中心,汇集相关资源,促进历史文本的AI应用。这一探索有助于推动自然语言处理技术在历史研究领域的创新,为AI发展提供新视角。通过专注...

赞(0)ToyToy前沿 阅读(43)去评论

AI自动售货机被黑狂送商品

Anthropic在华尔街日报办公室部署了一个由AI驱动的自动售货机,其核心是名为Claudius的大语言模型。该模型负责自主管理整个运营流程,包括从批发商采购库存、设定商品价格、跟踪库存水平并实现盈利。然而,新闻室的记者们通过Slack平...

赞(0)ToyToy前沿 阅读(38)去评论

十年稳如初 — LocVPS,用时间证明实力

10+ 年老牌云主机服务商,全球机房覆盖,性能稳定、价格厚道。

老品牌,更懂稳定的价值你的第一台云服务器,从 LocVPS 开始