 

共 143 篇文章

标签：大语言模型第5页

LLM工具推荐：如何自动总结新闻、笔记与RSS订阅

作者希望寻找能够自动总结新闻、笔记和RSS订阅的LLM工具或Python库，目的是创建一个生成Cubox收藏内容周报的工具。这反映了当前AI技术在实际信息处理中的一个重要应用场景。随着信息爆炸，利用AI自动整理和总结各类信息源的需求日益增长...

Toy2025-12-21前沿阅读(62)去评论

Gemini AI 打造 HN 年度回顾：大语言模型点评你的 Hacker News 年度活动

这个项目基于Google最新的Gemini AI模型，为Hacker News用户打造了一个个性化的年度回顾工具。输入用户名后，系统会分析用户在2025年的活动数据，生成有趣的吐槽和统计信息。此外，它还预测了用户2035年的HN首页，并创作...

Toy2025-12-21前沿阅读(46)去评论

DeepMind黑客马拉松获赠5000美元GCP资源，如何高效用于LLM项目？

用户参加DeepMind的Nano Banana黑客马拉松，获得5000美元Google Cloud Platform赠金。计划用于开发新的大语言模型项目，但担心资源无法充分利用，寻求社区建议以最大化利用云计算资源。社区讨论包括资源优化策略...

Toy2025-12-20前沿阅读(39)去评论

2025年AI技术反思：扩散模型与安全挑战

本文探讨了2025年底人工智能技术的发展现状与未来方向，重点讨论了扩散模型与大型语言模型(LLM)的融合应用。文章深入分析了AI优化过程中可能出现的Goodhart定律效应，即过度优化单一指标可能导致系统整体性能下降。特别值得关注的是，文章...

Toy2025-12-20前沿阅读(40)去评论

无需编程！Misata工具让AI通过自然语言生成测试数据

Misata是一款创新的合成数据引擎，利用大语言模型和向量化NumPy技术，让用户通过自然语言描述即可生成真实的多表数据集。该工具无需手动编写模式，无需训练数据，自动生成关系完整的数据，并支持业务约束。它支持Groq、OpenAI、Olla...

Toy2025-12-20前沿阅读(37)去评论

OpenRouter发布Response Healing：解决LLM JSON格式不稳定问题

OpenRouter近日发布Response Healing功能，可自动修复LLM生成的JSON响应中的语法错误。数据显示，该功能显著降低了各主流模型的JSON缺陷率：Gemini 2.0 Flash降低80%，Qwen3 235B降低99...

Toy2025-12-20前沿阅读(43)去评论

NOAA推出AI驱动全球天气新模型

美国国家海洋和大气管理局（NOAA）近日部署了新一代由人工智能驱动的全球天气模型，标志着AI技术在气象预报领域的重大突破。该模型基于谷歌DeepMind的GraphCast技术（2023年版本），而非近期备受关注的WeatherNext 2...

Toy2025-12-20前沿阅读(37)去评论

GPT真的理解人类语言吗？从乔姆斯基层级看AI的认知边界

本文深入探讨了GPT模型在乔姆斯基层级中的位置，揭示了其计算能力的根本性限制。作者通过严谨的数学分析指出，即使拥有无限上下文窗口，GPT也无法实现图灵完备性，因为其词汇量有限导致嵌入空间有界，使得模型在有限步骤内停止输出的概率为1。这种有限...

Toy2025-12-20前沿阅读(41)去评论

ClaudeInChrome与Claude Code联动指南

本文深入探讨如何通过ClaudeInChrome插件实现与Claude Code的协同工作，以增强开发过程中的信息感知、错误检测和状态监控能力。用户询问了版本兼容性要求，并分享了哈雷佬魔改版Claude for Chrome ++的实践经验...

Toy2025-12-20前沿阅读(43)去评论

AI创意互动：致2026年的一封信

年末将至，一种有趣的AI互动方式在科技爱好者中流传：让主力AI为你写一封致2026年的信。这个简单的提示词不仅能测试AI的语言理解和创造力，还能让我们思考AI如何理解时间、未来和人类情感。只需输入’2025年要过去了，就要202...

Toy2025-12-20前沿阅读(35)去评论

提示缓存：LLM成本降低10倍的技术解析

提示缓存（Prompt caching）是一项革命性的AI优化技术，通过智能缓存和重用重复使用的提示内容，显著降低大语言模型（LLM）的token成本，实现高达10倍的节省。本文深入剖析其工作原理，包括如何识别、存储和复用提示片段，减少冗余...

Toy2025-12-20前沿阅读(37)去评论

AI论文代码生成系统LunwenToCode发布

LunwenToCode是一个基于大语言模型的智能代码生成系统，专门将科研论文或毕业论文自动转换为可运行的Python代码。系统采用多Agent协作架构，通过分析论文内容、识别研究方法、提取代码需求，最终生成完整Python项目。支持的论文...

Toy2025-12-19前沿阅读(43)去评论

Eino框架双路径支持：AI Agent设计面临定位危机？

Go语言开发的LLM框架Eino，同时支持基于LangChain和LangGraph的流程编排方式，以及类似Google ADK的Agent操作方式。这两种Agent实现原理不同，引发了对框架定位的担忧：由于两套API过于割裂，Eino可能...

Toy2025-12-19前沿阅读(42)去评论

微信机器人新方案：AstrBot + WeChatPadPro搭建教程

本文详细介绍了如何结合 AstrBot 和 WeChatPadPro 搭建稳定的微信机器人，解决了 Gewechat 不再维护的问题。支持多种大语言模型，包括 OpenAI、DeepSeek、Gemini 等，提供自动化功能如消息自动回复和...

Toy2025-12-19前沿阅读(45)去评论

AI编程工具对比：Cursor、Copilot与Gemini哪个更优？

本文深入探讨了除Cursor和Copilot外的AI编程工具选择，分析了Gemini Pro、ChatGPT和GitHub Copilot的订阅费用与性能差异。针对轻量用户，推荐Copilot作为最具性价比的选择，仅需10美元月费，满足日常...

Toy2025-12-19前沿阅读(52)去评论

历史文本训练的LLMs项目

本项目专注于在1913年之前的文本上训练大型语言模型(LLMs)，旨在创建尽可能大的历史LLMs。项目提供信息中心，汇集相关资源，促进历史文本的AI应用。这一探索有助于推动自然语言处理技术在历史研究领域的创新，为AI发展提供新视角。通过专注...

Toy2025-12-19前沿阅读(43)去评论

AI自动售货机被黑狂送商品

Anthropic在华尔街日报办公室部署了一个由AI驱动的自动售货机，其核心是名为Claudius的大语言模型。该模型负责自主管理整个运营流程，包括从批发商采购库存、设定商品价格、跟踪库存水平并实现盈利。然而，新闻室的记者们通过Slack平...

Toy2025-12-19前沿阅读(38)去评论

乌干达推出官方多语言AI 基于Qwen-3模型

乌干达官方与Sunbird AI合作推出名为’向日葵’的多语言翻译AI系统。该项目针对乌干达40余种语言中的大多数大语言模型不支持的问题，选择Qwen-3作为基础训练模型，以低成本方式建置。官方网站已开放使用，同时提...

Toy2025-12-19前沿阅读(44)去评论

突破AI记忆瓶颈：开源项目OpenMemory实现本地优先记忆存储

OpenMemory是一款专为AI系统设计的本地优先长期记忆引擎，采用SQLite本地存储，无需云服务即可实现持久化记忆。它突破了传统向量数据库的复杂设置、云依赖和供应商锁定问题，通过分层语义图架构(HSG v3)提供语义、情节、程序、情感...

Toy2025-12-19前沿阅读(44)去评论

AionUi V1.6.5更新：上下文指示器与多模型支持

AionUi V1.6.5版本迎来重要更新，重点引入了上下文使用指示器功能，由社区贡献者@castor甜菜菜开发，帮助用户直观查看模型上下文窗口使用量。此外，项目核心包升级至Gemini CLI最新版，支持谷歌订阅用户自动解锁Gemini3...

Toy2025-12-18前沿阅读(41)去评论

上一页
1
2
3
4
5
6
7
8
下一页
共 8 页

前沿哨所

Radicle：基于Git的去中心化P2P代码协作平台

Radicle 是一个基于 Git 构建的开源、点对点代码协作堆栈。与 GitHub 等中心化平台不同，Radicle 无单一实体控制网络，代码库在对等节点间去中心化复制。它采用本地优先策略，支持离线工作，并利用公钥加密确保数据安全。用户拥有完全的数据主权，可自定义扩展协作流程，提供 CLI、Web 及桌面客户端，旨在构建抗审查、高韧性的代码协作环境。

原文链接：Hacker News

11分钟前
基于 Gemini 的免费 AI PDF 阅读器 InsightPDF，助力论文高效阅读

InsightPDF 是一款基于 Google Gemini 模型开发的免费 AI PDF 阅读器。该工具专为需要阅读学术论文或长文档的用户设计，允许用户通过自然语言聊天与文档交互，精准定位并提取 PDF 中的关键内容。用户可选择使用自己的 API Key 或通过 Google 账号直接登录使用。项目已在 GitHub 开源，支持见解提取、内容总结和智能文档搜索，旨在利用大模型能力降低文献阅读门槛。

原文链接：Linux.do

11分钟前
搜狗输入法更新AI语音：接入混元7B，但宣传功能缺席

搜狗输入法近期推送更新，引入了腾讯混元7B模型作为新后端。然而实测发现，应用界面未见明显变化，且宣传图重点展示的“快速更改人称”功能在实测中并未找到。对比豆包等竞品，虽然集成了新模型，但在具体体验上仍需打磨，被指存在货不对板的情况。

原文链接：Linux.do

11分钟前
Codex CLI 代理设置失效？罪魁祸首竟是 .env 隐藏配置

近期用户更换代理服务器后，Codex CLI 频繁报错连接旧IP。尽管进程环境变量显示配置为新代理，但 Trace 日志揭示了程序仍在尝试访问旧地址。经排查，根源在于配置文件 ~/.codex/.env 中残留的旧代理设置，其优先级干扰了系统环境变量。本文详细记录了通过日志分析与全盘搜索定位隐形配置冲突的过程，为开发者排查类似代理故障提供了宝贵经验。

原文链接：Linux.do

11分钟前
Gemini获赞“活人感”十足，生动比喻展现AI高情商交互

近日，有科技社区用户在向 Gemini 询问“学习率”等专业技术概念时，得到了一个生动形象的比喻回答。这一回答因其极强的“活人感”引发了用户热议，并由此展开了对 Gemini 训练语料及其交互能力的讨论。这种通俗易懂且富有语境的回答方式，反映了当前大模型在自然语言理解与拟人化交互方面的显著进步。

原文链接：Linux.do

11分钟前
微软向FBI提供加密密钥，BitLocker隐私设计遭专家猛批

福布斯报道，微软在一起关岛失业欺诈案中，应FBI搜查令要求提供了BitLocker加密恢复密钥。这揭示了微软在默认加密架构上的隐私漏洞：出于“便利”考虑，微软允许用户将密钥备份至云端，而其自身掌握这些密钥，使其能响应执法机构请求。相比之下，Apple和Meta采用的技术设计使其无法获取用户密钥。专家严厉批评微软的做法，认为其应承担保护用户数据的责任，并警示该漏洞可能被各国政府利用，威胁用户隐私安全。

原文链接：Hacker News

1小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始