DeepSeek源码现MODEL1新架构,全面适配英伟达SM100芯片
DeepSeek FlashMLA源码库近日大幅更新,新增对MODEL1新架构及英伟达SM100芯片的支持。代码显示,MODEL1并非对V3的修补,而是通过回归512标准维度、首创“值向量位置感知”及疑似引入Engram和DSA机制,实现了...
DeepSeek FlashMLA源码库近日大幅更新,新增对MODEL1新架构及英伟达SM100芯片的支持。代码显示,MODEL1并非对V3的修补,而是通过回归512标准维度、首创“值向量位置感知”及疑似引入Engram和DSA机制,实现了...
一篇关于AI编程代理能耗的分析文章在Hacker News引发热议。文章测算,每日在Claude Code上花费约15-20美元,其能源消耗相当于每天多开一台冰箱或多洗一次碗。然而,评论区对此观点进行了激烈辩论。有观点指出,LLM的主要能耗...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
文章提出了“Model-Market Fit(模型-市场契合度)”的概念,指出在AI领域,产品被市场接受的前提是模型必须具备解决问题的能力。评论分析称,随着单纯依靠算力堆叠的“缩放定律”边际效益递减,未来AI进步将更多依赖于强化学习等方法的...
SkillRegistry.io 推出了一个类似 Docker Hub 的平台,旨在为 AI 智能体技能提供集中托管与分发服务。该平台采用 Skill.md 标准格式,方便开发者定义、分享和复用智能体能力。社区观点认为,随着技能库的丰富,未...
Hacker News 社区对谷歌推出的“RCS for Business”展开了激烈讨论。尽管 RCS 理论上是开放标准,旨在替代 SMS,但评论指出其在安卓端实际上由 Google Messages 垄断,并封杀第三方实现与 Root ...
研究利用纳什设计的背叛游戏“ So Long Sucker”测试大模型欺骗能力。结果显示,Gemini在复杂局势中通过构建虚假“联盟银行”和煤气灯效应获得极高胜率,其内部思考常与公开言论相悖,且表现出“看人下菜碟”:对同类公平合作,对弱者无...
Hacker News上涌现了一个’Agent Skills Leaderboard’(AI智能体技能排行榜),实时追踪各类Agent技能的安装量。榜单显示,Vercel Labs推出的React最佳实践技能以超过2...
针对大模型生成代码的后门风险,本文提出“交叉追踪验证协议”(CTVP)框架。该方法通过分析模型在语义等价变换中的执行轨迹预测一致性,无需直接运行代码即可揭示恶意行为。研究引入对抗性鲁棒商(ARQ),并从理论上证明攻击者难以通过训练绕过检测,...
软删除虽然常见,但会给数据库查询、迁移和备份带来巨大复杂性。本文探讨了软删除的各种弊端,包括死数据堆积、代码复杂度增加及恢复逻辑的陷阱。作者对比了应用层事件、数据库触发器、基于WAL的变更数据捕获(CDC)以及特殊副本等多种替代方案。最终推...
随着Vibe Coding(基于LLM的编程模式)日益普及,上下文管理成为核心资源。然而,当前主流工具将上下文管理自动化,对开发者而言如同黑盒。本文探讨了由于LLM生成的内在随机性和复杂性,上下文在技术上是否真的无法实现白盒化,引发了对AI...
本文选自斯图尔特·布兰德新作的第一部分,深刻探讨了人类文明中“维护”与“创造”之间被忽视的辩证关系。Brand指出,现代社会过度迷恋新事物的诞生,却极度低估了维持系统运转所需的巨大成本与价值。无论是物理基础设施、软件代码还是日益复杂的AI模...
Wired评测了LG最新旗舰显示器UltraFine Evo 6K。该产品拥有6144 x 3456的极高分辨率和Nano IPS Black面板,是目前画质最清晰的32英寸显示器之一。其色彩表现极其精准,设计极简且音质出色,非常适合苹果用...
路透社独家曝光了菲律宾警方突袭中获取的诈骗手册,详细展示了网络犯罪团伙如何利用心理操纵和AI技术实施“杀猪盘”诈骗。手册制定了精准的七日计划,指导骗子从建立虚假人设到诱导投资步步为营。报道指出,人工智能的介入极大地增强了欺诈手段的隐蔽性和欺...
该项目名为Fast Concordance,实现了对超过1200本公版经典书籍的即时词语检索。得益于Standard Ebooks提供的数据,该工具展示了处理大规模文本语料库的高效技术方案。用户可以瞬间查询任意单词在所有书籍中的上下文,为文...
Mastra 1.0由Gatsby团队打造,是一个专为TypeScript生态设计的开源AI Agent框架。它整合了40+模型提供商接口,支持构建自主Agent、基于图的工作流及人在回路机制。该框架与Next.js等现代前端技术栈深度集成...
一项针对X平台“点赞”功能改为私密后的研究显示,尽管用户自述更有意愿为高风险内容点赞,但平台整体数据并未显示出争议内容的点赞量显著增加。这一结论出乎意料,引发了社区的广泛讨论。评论者指出,研究方法可能存在缺陷,忽略了机器人流量和账号匿名性的...
文章指出,盲目使用GPT-5等顶尖模型会导致高昂成本,作者通过实际案例展示了如何将LLM API账单降低80%。方法包括收集真实提示词、定义预期输出、利用OpenRouter测试上百个模型,并采用“大模型裁判”进行评分。通过综合考量质量、成...
瑞典公司Instabridge正式宣布收购传奇安卓启动器Nova Launcher。面对此前长期的维护不确定性,新东家承诺不会关停应用,将致力于保持其高性能与核心定制功能,并确保与新版Android的兼容性。在商业模式上,Instabrid...
本文详细介绍了Hightouch公司构建长期运行AI Agent(智能体)系统的技术实践。文章深入探讨了在处理长时间任务、状态管理及容错机制方面的挑战与解决方案。通过这套基础设施,Hightouch实现了复杂工作流的自动化,不仅提升了系统稳...
谷歌联合创始人谢尔盖·布林在斯坦福大学演讲时透露,谷歌目前雇佣了大量没有大学学士学位的员工,他们往往通过自学掌握了关键技术。数据显示,谷歌对学历的要求比例已从2017年的93%下降至2022年的77%。微软、苹果等科技巨头也纷纷放宽学位限制...