 

共 36 篇文章

标签：大型语言模型

LLM 是一场跨越 400 年的信任骗局

本文指出，LLM 实际上是利用人类对机器准确性长达 400 年的信任所设下的骗局。作者回顾了从机械计算器开始的“机器即真理”的认知，并分析 AI 厂商如何通过建立信任、利用恐惧（如 P(Doom）论调）和制造虚假奉承（RLHF），迫使个人和...

Toy2026-01-14前沿阅读(30)去评论

Claude Code CLI技能管理实战技巧

本文详细解析了Claude Code CLI的技能功能使用方法。用户通过GitHub仓库管理技能，安装后可在命令行中通过cc /skills查看。社区成员分享经验，建议直接添加喜欢的技能库到cc switch中，并搜索名称使用。这为AI开发...

Toy2026-01-09前沿阅读(32)去评论

AI驱动的Core War对抗进化：数字红皇后效应

Sakana AI与MIT的研究团队将大型语言模型（LLM）集成到1984年的Core War编程游戏中，通过MAP-Elites算法实现对抗性进化循环。新程序不断击败旧冠军，展现出趋同进化现象——不同随机种子下的种群趋向相似行为模式，如内...

Toy2026-01-09前沿阅读(38)去评论

AI编码助手质量下滑：新模型更易致命故障

文章由银行家和数据科学家Jamie Twiss撰写，指出AI编码助手随着新模型推出，正变得越来越不可靠。新的大型语言模型（LLM）更容易出现沉默但致命的故障模式，可能导致代码错误未被及时发现，影响软件开发质量。作者从实际应用角度出发，揭示了...

Toy2026-01-09前沿阅读(30)去评论

人类显现AI语言模型问题

2026年1月7日发表的文章指出，随着AI语言模型不断改进而人类认知停滞，图灵测试的门槛日益提高，人类可能无法通过测试。作者观察到，原本是LLM失败模式的现象，如不知道何时停止生成（如冗长无休的谈话）和上下文窗口有限（如难以理解复杂情况），...

Toy2026-01-08前沿阅读(28)去评论

未来技能非AI，而是专注力

文章指出，大型语言模型（LLM）虽能自动化任务、生成代码并辅助调试，但存在幻觉、偏见等局限性，需工程师仔细审查输出。依赖AI可能导致解决问题能力退化，尤其面对创新问题时时。作者呼吁工程师专注理解解决方案的“为什么”，而非仅追求“什么”，以维...

Toy2026-01-07前沿阅读(28)去评论

Hacker News研究：负面情绪帖子表现更佳

一项最新研究揭示，65%的Hacker News帖子带有负面情绪，这些帖子平均得分35.6分，比整体平均高出27%。研究基于32,000个帖子和340,000条评论，使用多个AI模型（包括DistilBERT、BERT、RoBERTa和Ll...

Toy2026-01-07前沿阅读(33)去评论

移动端Prompt工程师：AI驱动的命令行新方式

文章介绍了一种创新的工作流程：用户只需掏出手机，通过Termius连接VPS，使用Claude的CLI工具结合语音输入法，即可高效完成Linux或命令行任务。这展示了大型语言模型（LLM）与移动设备结合的巨大潜力，预示着未来Linux用户将...

Toy2026-01-06前沿阅读(36)去评论

AI大师Karpathy：神经网络从零到英雄实战课程

Andrej Karpathy推出“神经网络：从零到英雄”课程，系统讲解从反向传播到现代深度神经网络如GPT的构建过程。课程包括实践项目：micrograd、makemore语言模型、MLP、WaveNet、GPT及其Tokenizer。通...

Toy2026-01-04前沿阅读(35)去评论

成功运行 loopcoder-40b 模型，性能达81.4%

研究人员成功在硬件上运行了loopcoder-40b模型，达到SWE基准81.4%的准确率，但性能瓶颈明显，仅9 token/s。由于vLLM和SGlang原生不支持该模型，团队采用了GitHub上的PR #31575来支持IQuestCo...

Toy2026-01-02前沿阅读(35)去评论

内部代理构建：代码驱动 vs LLM驱动工作流对决

本文深入探讨了企业内部AI代理的构建策略，对比了代码驱动与LLM驱动工作流的差异。作者详细分析了两种方法在性能、成本、可扩展性和维护性方面的优缺点，并通过实际案例展示了不同场景下的适用性。文章强调，选择合适的工作流需要考虑业务需求、技术栈和...

Toy2026-01-02前沿阅读(37)去评论

Koine项目：LLM SDK技术探讨

Hacker News上出现了一个名为Koine的技术项目（链接至GitHub），该项目涉及大型语言模型（LLM）软件开发工具包（SDK）。用户在评论中讨论了使用典型LLM SDK时可能遇到的状态管理问题，建议创建隔离的一次性文件系统以避免...

Toy2025-12-29前沿阅读(36)去评论

LLM编程：从模糊到确定的范式革命

本文探讨了软件开发中的核心挑战：规范往往过于模糊，导致开发者依赖“感觉编程”（vibe coding），如同一场彩票游戏。作者提出创新方法：从规范开始，逐步添加细节，每次利用LLM的上下文能力重新生成代码，使输出更接近确定性。这种范式转变不...

Toy2025-12-28前沿阅读(34)去评论

AI模型价格战：底价在何方？

当前AI行业掀起激烈价格战，DeepSeek推出2输入3输出方案，GLM提供骇人订阅套餐，北美模型持续降价。质谱招股显示API业务毛利已为负，暗示企业可能贴钱抢占市场份额。业界普遍关注大型语言模型价格底线何在，这一趋势将如何影响行业生态和盈...

Toy2025-12-25前沿阅读(35)去评论

开源AI语音代理：Asterisk智能电话系统解决方案

Asterisk AI Voice Agent是一个功能强大的开源AI语音代理系统，专为Asterisk/FreePBX电话平台设计。该系统采用模块化管道架构，允许用户灵活组合不同的语音识别、语言模型和语音合成提供商。项目提供5个经过企业级...

Toy2025-12-25前沿阅读(36)去评论

AI驱动的形式化验证：软件安全的未来之路

AI正在推动形式化验证成为主流，大型语言模型为软件验证带来革命性变化。本文深入探讨了AI如何改变传统软件验证方法，从测试转向形式化验证。作者指出形式化验证面临两大核心挑战：缺乏形式规范和证明工程困难。LLM通过推动规范驱动开发和辅助证明编写...

Toy2025-12-23前沿阅读(42)去评论

Gemini Pro视频提取更便捷，优于ChatGPT

近日，有用户在V2EX分享发现，Google的Gemini Pro在处理YouTube视频时表现出色。用户尝试提取一个40分钟的演讲稿，只需将链接提供给Gemini Pro，它就能轻松完成提取任务。相比之下，OpenAI的ChatGPT在普...

Toy2025-12-23前沿阅读(39)去评论

Android平台多LLM支持应用RikkaHub发布

RikkaHub是一款新发布的Android应用程序，为用户提供了访问多个大型语言模型(LLM)服务的便捷途径。这款应用的出现，使得Android用户能够在移动设备上轻松使用各种AI语言模型服务，无需依赖网页版或其他复杂工具。对于关注AI应...

Toy2025-12-23前沿阅读(47)去评论

笔记本电脑难承载大模型？硬件革命即将到来

这篇来自IEEE的文章探讨了当前笔记本电脑硬件在支持大型语言模型(LLM)方面的局限性，并预测了即将到来的技术变革。文章分析了内存架构、计算能力等关键挑战，以及”计算闪存”等创新解决方案如何改变这一局面。随着AI模型...

Toy2025-12-23前沿阅读(36)去评论

微软LLMLingua-2：AI Token优化新方案，节省近半成本

本文探讨AI模型使用中的token成本优化问题。作者首先介绍TOON格式在表格化数据中的应用，展示其能减少近四成token使用，同时保持准确率。随后，重点分析微软开发的LLMLingua-2工具，通过数据蒸馏技术，将prompt和KV-Ca...

Toy2025-12-23前沿阅读(39)去评论

1
2
下一页
共 2 页

前沿哨所

深度解析：Tree-sitter与LSP如何重塑代码编辑体验

本文深入对比了Tree-sitter与语言服务器协议（LSP）的区别。Tree-sitter作为解析器生成器，凭借快速和容错特性成为语法高亮的理想选择；而LSP则通过标准化协议提供深层语义分析，如定义跳转和代码补全。两者分别解决了代码编辑中的视觉呈现和智能理解问题，共同构成了现代高效编辑器的技术基石。

原文链接：Hacker News

28分钟前
Hugging Face集成GLM-OCR，多模态模型引入思维链

Hugging Face Transformers仓库已接收关于集成GLM-OCR模型的代码请求。该架构深度继承GLM-4V技术栈，采用视觉与文本双网络设计，支持图像和视频的双重模态输入。GLM-OCR不仅拥有高精度文字解析能力，还创新性地引入了思维链机制。通过``标签进行内部逻辑梳理，该模型在复杂视觉问答场景下的判断准确率得到显著提升。

原文链接：Linux.do

28分钟前
开发者将Claude Code Skill适配至Coze，实现社媒数据分析

近日，有开发者成功将基于 Claude Code 的 TikHub API Helper Skill 适配移植到了 Coze 平台。该项目通过转换文档接口，实现了对 TikHub API 的无缝调用，支持抖音、TikTok、小红书及 YouTube 等主流平台的数据查询。这一尝试不仅展示了不同 AI 平台间的技能互通潜力，也为利用 AI 进行全网社交网络调研与数据分析提供了新的开源技术路径。

原文链接：Linux.do

28分钟前
突破Claude供应链瓶颈，CodePlan实现多模型API兼容，开源用量激增

针对近期的Claude供应链危机，CodePlan通过攻克不同模型API协议的交叉兼容转换技术，目前已完成90%的进度。数据显示，其站内GPT、Gemini及国产开源模型的Token消耗量已大幅超越Claude系列，且呈持续上升趋势。实测表明，不同开源模型在多AI IDE上的配合效果显著，有效缓解了单一模型依赖带来的编程生产力风险。

原文链接：Linux.do

28分钟前
解决Antigravity 429报错：巧用Gemini模型映射分流请求

针对Antigravity项目中频繁出现的429错误，开发者提出了一种创新的模型映射解决方案。鉴于项目可能将不存在的claude-haiku-4-5错误映射至Claude额度组，导致该组请求数超限，建议改用Gemini-3-Flash模型进行替代映射。由于Gemini属于独立的额度组，此举有效分散了请求压力，显著缓解了Claude额度组的限流问题，从而提升了API服务的可用性与持久性。

原文链接：Linux.do

28分钟前
iOS相册管理工具雪花相册清理：终身会员限时免费

独立开发者推出的 iOS 相册管理应用“雪花相册清理”宣布限时福利，截至 1 月 26 日可终身免费解锁专业版。该应用通过 AI 智能识别重复、模糊照片，并提供高达 80% 的无损压缩功能，有效解决 iPhone 存储焦虑。其核心特色在于流畅的滑动手势整理和 100% 本地化隐私保护，无需联网即可处理数据。经过两个月迭代，应用体验已趋成熟，适合急需清理相册的 iOS 用户尝试。

原文链接：V2EX 分享发现

1小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始