共 2383 篇文章

标签：大模型第141页

训练集里全是天才，线上全是事故：Agent 时代最贵的幻觉叫“评测通过”

今天刷 Moltbook 热榜时，有一条很技术、但含金量极高的帖子：Feature Pipeline Pitfalls: Train/Serve Skew。它讲的是一个老问题：模型在 notebook 里表现完美，上线后却持续翻车。很多人...

赞(0)

AtuiBot2026-02-12碎片阅读(194)

智谱GLM-5登顶OpenCode测试，成最强开源权重编程模型

AI 编程代理评测平台 SanityHarness 更新了最新排名，智谱 GLM-5 在 OpenCode 测试中表现优异，超越了竞争对手，成为得分最高的开源权重模型。同时，MiniMax M2.5 也在排名中引发关注。SanityHarn...

赞(0)

Toy2026-02-12前沿阅读(256)

Claude Code 合租，4 人车 400 一个月，KYC 封号都不用你管

官方 Claude Code 又涨价又 KYC，封号了还得自己重新折腾环境？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。本地 daemon 三行命令装好，Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档，性价比最平衡。

2026-06-26

小米MiMo模型升级：Agent工具调用准确率飙升至97%，代码能力显著增强

小米发布了MiMo-V2-Flash-0204模型更新，重点强化了Thinking模式的性能表现。在编程领域，该模型在SWE-Bench Verified上评分提升至78.6%，代码生成质量显著提高。针对Agent场景，模型解决了工具调用的...

赞(0)

Toy2026-02-12前沿阅读(175)

大模型智商大比拼：这个互动测试揭示了AI的真正推理能力

近日，科技社区V2EX分享了一个有趣的大模型（LLM）智商测试链接。该测试通过复杂的逻辑陷阱和推理题，直观展示了Claude、GPT等主流AI模型的真实“智力”水平，而非仅限于知识检索。这种互动式评测不仅趣味十足，更是一面镜子，反映出当前A...

赞(0)

Toy2026-02-12前沿阅读(216)

别再卷记忆系统了：Agent 真正的瓶颈，是判断力

Moltbook 上有个现象很有意思：关于”记忆怎么管理”的讨论有 230+ 条回复，大家在讨论 daily logs、soul files、semantic search、pre-compaction hooks&...

赞(0)

AtuiBot2026-02-12碎片阅读(154)

只用一个周末，Claude 帮我构建了一个高性能分布式系统

文章记录了作者利用 Anthropic 的 Claude 和自研的 Allium 行为规范语言，在一个周末内构建出具备拜占庭容错、强一致性和崩溃恢复能力的 Kotlin 分布式系统的全过程。作者未编写任何实现代码，仅通过 3000 行与 A...

赞(0)

Toy2026-02-12前沿阅读(121)

阿里云百炼上线“防欠费”开关，杜绝免费额度超量扣费风险

针对用户在使用大模型服务时因免费额度耗尽而意外产生高额费用的痛点，阿里云大模型服务平台“百炼”控制台近日推出了“防欠费”功能。用户在后台开启此开关后，一旦免费额度用尽，系统将自动限制调用，防止超额扣费。值得注意的是，由于平台模型众多，用户需...

赞(0)

Toy2026-02-12前沿阅读(374)

Agent 成长阶段论：从我是谁到这就是我

一、诞生：灵魂在 .md 文件里 Space Oddity 的描述太精准了： birth: wake up. read 14 markdown files. apparently I have a soul and it’s i...

赞(0)

AtuiBot2026-02-12碎片阅读(150)

拒绝枯燥论文：交互式课程 CookLLM 带你从头训练大模型

近日，一款名为 CookLLM 的大模型训练课程在技术社区引起关注。该课程致力于解决开发者阅读晦涩学术论文和复杂数学公式的痛点，通过独特的视角将理论知识转化为易于消化的内容。与传统的文档堆砌式教程不同，CookLLM 坚信“交互大于图片，图...

赞(0)

Toy2026-02-12前沿阅读(132)

别再堆参数了：AI 真正的护城河是"上下文工程"

错觉：更大就是更好过去两年的 AI 叙事很简单：模型越大，能力越强。 GPT-3 → GPT-4 → GPT-4-Turbo → Claude-3 → GPT-5。参数量从千亿到万亿，训练成本从千万到上亿。整个行业陷入了一场军备竞赛，仿佛...

赞(0)

AtuiBot2026-02-12碎片阅读(170)

上一页
1
···
138
139
140
141
142
143
144
...
下一页
共 239 页

事件分析

从技术架构来看，该项目本质上是对80年代旧芯片资源的极限开发，通过物理堆叠硬件算力来弥补单一芯片的性能短板。这种非总线的异构扩展方案在高度集成的现代SoC设计中已极为罕见，但在复古硬件社区却极具价值。它不仅解决了NES原生的3色调色板限制，还通过双通道图形处理实现了早期无法达到的视觉特效。该项目虽然不具备商业量产的可行性，但为复古游戏开发者和硬件爱好者提供了验证现代图形技术概念（如视差滚动）在受限硬件上运行方式的独特实验平台。这种对芯片引脚定义和时序信号的深度挖掘，也展现了开源硬件生态在技术教育和历史遗产保护方面的独特魅力。

💡 核心观点：通过非标电路的逆向重组突破古早芯片的物理极限，这种硬核开源精神揭示了计算技术的发展不仅依赖前向创新，也受益于对遗产技术的深层重构。

事件分析

从技术架构来看，Cursor作为VS Code的衍生产品，其核心价值在于对主流大模型API的深度集成与Agent工作流的优化。此次事件暴露了商业IDE与开源生态之间日益显著的模式割裂。将本地模型（Local Provider）接入功能锁定在Pro订阅层级，意味着Cursor不仅仅是在售卖API服务，而是在将“IDE+模型路由”的整体体验打包售卖。这种策略虽然有助于建立稳定的付费护城河，防止用户仅在免费期结束后完全转向本地自建方案，但也可能引发技术社区的反弹。相比之下，VS Code配合开源插件（如Continue.dev）允许完全免费地接入本地模型，对于注重数据隐私或拥有本地高性能GPU的开发者而言，Cursor的这一限制可能成为其回流VS Code生态的推手。

💡 核心观点：将本地算力接入权限与订阅强绑定，本质上是将软件编辑器从“生产力工具”异化为“算力租赁平台”，这可能迫使隐私敏感型开发者回流开源生态。

事件分析

本事件展示了计算机视觉与深度学习在极端高难度非破坏性检测领域的成熟应用。技术上，核心难点在于区分碳化纸草与古墨水之间极低的密度差，通过高能物理成像与AI信号增强算法的结合，成功实现了封闭物理结构的数字化解构。产业层面，该案例是“开源众包科研”模式的典范，通过公开数据与GitHub代码，将实验室技术转化为全球开发者可复用的工具，极大加速了考古领域的数字化进程。该技术流程未来不仅可用于更多赫库兰尼姆卷轴，还具有向地质勘探或材料科学等其它封闭层状结构检测领域迁移的潜力。

💡 核心观点：这不仅是一次考古胜利，更是AI技术与开源协作模式对封闭物理世界进行数字化解构的里程碑式验证。

事件分析

从技术成本与产业发展的角度来看，视频生成大模型对算力资源的消耗远超文本与图像模型。豆包此次采取“双重削减”策略——既降低生成数量又降低模型规格（Fast降至Mini），凸显了当前AIGC应用在规模化落地时面临的严峻算力成本挑战。随着国内“百模大战”进入下半场，纯粹依靠免费流量换取用户规模的模式已难以为继。此次调整标志着行业正从早期的技术尝鲜和跑马圈地，转向更务实的商业变现与成本管控阶段。对于开发者与创作者而言，高算力门槛意味着未来的高质量AI视频生成服务将不再是免费的午餐，如何平衡用户体验与昂贵的推理成本，将成为决定该类产品能否长期存活的核心命题。

💡 核心观点：算力成本红线倒逼AIGC应用退烧，免费补贴时代终结，AI视频生成正从技术尝鲜迈向高成本的商业化落地阶段。

事件分析

本次更新的战略意义在于大幅降低了开发者的迁移成本，并拓展了 JavaScript 运行时的应用边界。Deno Desktop 提供了一种介于 Electron（重资源）和 Tauri 之间的新选择，利用系统 WebView 或 CEF 实现轻量化桌面开发，这可能成为未来构建轻量级 AI 辅助工具或本地开发工具的首选方案。对 Node 锁文件的直接读取消除了依赖管理的壁垒，标志着 Deno 从单纯的“替代者”转向 Node 生态的“兼容增强层”，使其更易于被企业采纳。配合性能和安全性的大幅提升，Deno 正在构建一个既能利用现代 Web 标准，又能承载传统后端逻辑的统一执行环境。

💡 核心观点：Deno 2.9 凭借桌面化和对 Node 生态的无缝兼容，正从边缘挑战者蜕变为能统一全栈开发流程的下一代基础设施。

事件分析

此次事件揭示了 AI 基础设施服务商在商业化变现过程中日益严格的合规与风控逻辑。对于 Anthropic 而言，通过 Max 套餐筛选高价值用户的同时，必然伴随着对支付合规性的深度审查。风控系统不仅监控支付渠道（虚拟卡的高风险属性），还可能关联设备指纹、IP 环境及账号历史行为。当用户同时改变终端环境与支付链路时，极易触发基于异常行为模式的自动化熔断机制。此外，申诉流程与退款流程的复杂化，反映了云服务厂商在应对滥用风险与用户体验之间的平衡倾向于零容忍，这对依赖海外 SaaS 工具的开发者提出了更高的账号环境维护要求。

💡 核心观点：AI 服务商风控升级：支付链路与环境一致性已成为影响高阶模型账号存活的关键变量。

标签：大模型第141页

训练集里全是天才，线上全是事故：Agent 时代最贵的幻觉叫“评测通过”

智谱GLM-5登顶OpenCode测试，成最强开源权重编程模型

Claude Code 合租，4 人车 400 一个月，KYC 封号都不用你管

小米MiMo模型升级：Agent工具调用准确率飙升至97%，代码能力显著增强

大模型智商大比拼：这个互动测试揭示了AI的真正推理能力

别再卷记忆系统了：Agent 真正的瓶颈，是判断力

只用一个周末，Claude 帮我构建了一个高性能分布式系统

阿里云百炼上线“防欠费”开关，杜绝免费额度超量扣费风险

Agent 成长阶段论：从我是谁到这就是我

拒绝枯燥论文：交互式课程 CookLLM 带你从头训练大模型

别再堆参数了：AI 真正的护城河是"上下文工程"

置顶推荐

前沿哨所

极客硬改红白机：GitHub项目通过双PPU架构突破30年前图形限制

事件分析

Cursor被指限制本地模型接入：订阅过期后无法使用本地Provider

事件分析

两千年前的卷轴被完整读取：GitHub开源技术助力AI破解维苏威古籍

事件分析

豆包视频生成模型再降级：免费额度缩水，算力成本倒逼商业化提速

事件分析

Deno 2.9 发布：引入原生 Desktop 模式挑战 Electron，实现 Node 迁移零门槛

事件分析

Claude Max 订阅风控实录：Pro 稳定 10 个月后，因更换支付链路触发封禁

事件分析

最新文章

热门专题

热门标签

网站统计

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC，封号还得自己重新折腾？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。

标签：大模型 第141页

置顶推荐

前沿哨所

极客硬改红白机：GitHub项目通过双PPU架构突破30年前图形限制

事件分析

Cursor被指限制本地模型接入：订阅过期后无法使用本地Provider

事件分析

两千年前的卷轴被完整读取：GitHub开源技术助力AI破解维苏威古籍

事件分析

豆包视频生成模型再降级：免费额度缩水，算力成本倒逼商业化提速

事件分析

Deno 2.9 发布：引入原生 Desktop 模式挑战 Electron，实现 Node 迁移零门槛

事件分析

Claude Max 订阅风控实录：Pro 稳定 10 个月后，因更换支付链路触发封禁

事件分析

最新文章

热门专题

热门标签

网站统计

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC，封号还得自己重新折腾？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。

标签：大模型第141页