LLM 是一场跨越 400 年的信任骗局
本文指出,LLM 实际上是利用人类对机器准确性长达 400 年的信任所设下的骗局。作者回顾了从机械计算器开始的“机器即真理”的认知,并分析 AI 厂商如何通过建立信任、利用恐惧(如 P(Doom)论调)和制造虚假奉承(RLHF),迫使个人和...
本文指出,LLM 实际上是利用人类对机器准确性长达 400 年的信任所设下的骗局。作者回顾了从机械计算器开始的“机器即真理”的认知,并分析 AI 厂商如何通过建立信任、利用恐惧(如 P(Doom)论调)和制造虚假奉承(RLHF),迫使个人和...
本文详细解析了Claude Code CLI的技能功能使用方法。用户通过GitHub仓库管理技能,安装后可在命令行中通过cc /skills查看。社区成员分享经验,建议直接添加喜欢的技能库到cc switch中,并搜索名称使用。这为AI开发...
Sakana AI与MIT的研究团队将大型语言模型(LLM)集成到1984年的Core War编程游戏中,通过MAP-Elites算法实现对抗性进化循环。新程序不断击败旧冠军,展现出趋同进化现象——不同随机种子下的种群趋向相似行为模式,如内...
文章由银行家和数据科学家Jamie Twiss撰写,指出AI编码助手随着新模型推出,正变得越来越不可靠。新的大型语言模型(LLM)更容易出现沉默但致命的故障模式,可能导致代码错误未被及时发现,影响软件开发质量。作者从实际应用角度出发,揭示了...
2026年1月7日发表的文章指出,随着AI语言模型不断改进而人类认知停滞,图灵测试的门槛日益提高,人类可能无法通过测试。作者观察到,原本是LLM失败模式的现象,如不知道何时停止生成(如冗长无休的谈话)和上下文窗口有限(如难以理解复杂情况),...
文章指出,大型语言模型(LLM)虽能自动化任务、生成代码并辅助调试,但存在幻觉、偏见等局限性,需工程师仔细审查输出。依赖AI可能导致解决问题能力退化,尤其面对创新问题时时。作者呼吁工程师专注理解解决方案的“为什么”,而非仅追求“什么”,以维...
一项最新研究揭示,65%的Hacker News帖子带有负面情绪,这些帖子平均得分35.6分,比整体平均高出27%。研究基于32,000个帖子和340,000条评论,使用多个AI模型(包括DistilBERT、BERT、RoBERTa和Ll...
文章介绍了一种创新的工作流程:用户只需掏出手机,通过Termius连接VPS,使用Claude的CLI工具结合语音输入法,即可高效完成Linux或命令行任务。这展示了大型语言模型(LLM)与移动设备结合的巨大潜力,预示着未来Linux用户将...
Andrej Karpathy推出“神经网络:从零到英雄”课程,系统讲解从反向传播到现代深度神经网络如GPT的构建过程。课程包括实践项目:micrograd、makemore语言模型、MLP、WaveNet、GPT及其Tokenizer。通...
研究人员成功在硬件上运行了loopcoder-40b模型,达到SWE基准81.4%的准确率,但性能瓶颈明显,仅9 token/s。由于vLLM和SGlang原生不支持该模型,团队采用了GitHub上的PR #31575来支持IQuestCo...
本文深入探讨了企业内部AI代理的构建策略,对比了代码驱动与LLM驱动工作流的差异。作者详细分析了两种方法在性能、成本、可扩展性和维护性方面的优缺点,并通过实际案例展示了不同场景下的适用性。文章强调,选择合适的工作流需要考虑业务需求、技术栈和...
Hacker News上出现了一个名为Koine的技术项目(链接至GitHub),该项目涉及大型语言模型(LLM)软件开发工具包(SDK)。用户在评论中讨论了使用典型LLM SDK时可能遇到的状态管理问题,建议创建隔离的一次性文件系统以避免...
本文探讨了软件开发中的核心挑战:规范往往过于模糊,导致开发者依赖“感觉编程”(vibe coding),如同一场彩票游戏。作者提出创新方法:从规范开始,逐步添加细节,每次利用LLM的上下文能力重新生成代码,使输出更接近确定性。这种范式转变不...
当前AI行业掀起激烈价格战,DeepSeek推出2输入3输出方案,GLM提供骇人订阅套餐,北美模型持续降价。质谱招股显示API业务毛利已为负,暗示企业可能贴钱抢占市场份额。业界普遍关注大型语言模型价格底线何在,这一趋势将如何影响行业生态和盈...
Asterisk AI Voice Agent是一个功能强大的开源AI语音代理系统,专为Asterisk/FreePBX电话平台设计。该系统采用模块化管道架构,允许用户灵活组合不同的语音识别、语言模型和语音合成提供商。项目提供5个经过企业级...
AI正在推动形式化验证成为主流,大型语言模型为软件验证带来革命性变化。本文深入探讨了AI如何改变传统软件验证方法,从测试转向形式化验证。作者指出形式化验证面临两大核心挑战:缺乏形式规范和证明工程困难。LLM通过推动规范驱动开发和辅助证明编写...
近日,有用户在V2EX分享发现,Google的Gemini Pro在处理YouTube视频时表现出色。用户尝试提取一个40分钟的演讲稿,只需将链接提供给Gemini Pro,它就能轻松完成提取任务。相比之下,OpenAI的ChatGPT在普...
RikkaHub是一款新发布的Android应用程序,为用户提供了访问多个大型语言模型(LLM)服务的便捷途径。这款应用的出现,使得Android用户能够在移动设备上轻松使用各种AI语言模型服务,无需依赖网页版或其他复杂工具。对于关注AI应...
这篇来自IEEE的文章探讨了当前笔记本电脑硬件在支持大型语言模型(LLM)方面的局限性,并预测了即将到来的技术变革。文章分析了内存架构、计算能力等关键挑战,以及”计算闪存”等创新解决方案如何改变这一局面。随着AI模型...
本文探讨AI模型使用中的token成本优化问题。作者首先介绍TOON格式在表格化数据中的应用,展示其能减少近四成token使用,同时保持准确率。随后,重点分析微软开发的LLMLingua-2工具,通过数据蒸馏技术,将prompt和KV-Ca...
最新评论
Flash版本的响应速度确实提升明显,但我在使用中发现对中文的理解偶尔会出现一些奇怪的错误,不知道是不是普遍现象?
遇到过类似问题,最后发现是网络环境的问题。建议加一个超时重试机制的示例代码。
谢谢分享,我是通过ChatGPT的索引找到这里来的。
十年打磨一个游戏确实罕见,这种专注度在快节奏的游戏行业很难得。从Braid到The Witness,每作都是精品。
快捷键冲突是个很实际的问题,我自己也被这个问题困扰过。最后通过自定义快捷键组合解决了。
会议摘要这个功能很实用,特别是对经常需要参加长会议的人。不过三次免费使用确实有点少了。
硕士背景转AI基础设施,这个路径其实挺常见的。建议多关注底层系统知识,而不只是模型应用层面。
配置虽然简单,但建议补充一下认证和加密的注意事项,避免被中间人攻击。