监测数据显示 Claude Opus 近期智力显著退化,编程能力大幅下滑
根据 Marginlab.ai 针对 SWE-Bench-Pro 的性能追踪数据,Anthropic 旗舰模型 Claude Opus 在过去 30 天内出现了统计显著的性能退化。数据显示其代码生成与解决复杂问题的能力有所下滑。这一现象引发...
根据 Marginlab.ai 针对 SWE-Bench-Pro 的性能追踪数据,Anthropic 旗舰模型 Claude Opus 在过去 30 天内出现了统计显著的性能退化。数据显示其代码生成与解决复杂问题的能力有所下滑。这一现象引发...
开发者发布了一款名为“parafork”的并行开发工具,旨在解决多 AI Agent 同时协作时的代码冲突问题。该工具基于 Git Worktree 技术构建,目前支持 Linux 和 Windows 系统。Parafork 能够为每个 A...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
这是一份专为非技术人员打造的“AI编程智能体”上手指南。随着代码智能体的崛起,不懂代码也能开发软件已成现实,但驾驭它们需要理解本地与远程、终端、Git版本控制及环境变量等底层逻辑。文章深入浅出地解析了这些概念,并重点介绍了如何通过Syste...
Aion (灵汐) 是一款专为 macOS 设计的闲置应用管理工具,旨在通过“设置即忘”的理念优化系统资源。与传统的进程清理软件不同,Aion 具备多维感知能力,能识别音频、视频、下载及会议状态,避免误杀关键进程。其核心亮点包括:与 mac...
xAI 正式推出 Grok Imagine 1.0 版本,标志着其在多模态生成领域的重大突破。新版本核心亮点在于新增了最长 10 秒的视频生成功能,分辨率提升至 720p,并同步优化了音频质量,使得生成的音视频内容更加逼真流畅。此外,模型对...
智谱AI正式发布并开源轻量级多模态文档解析模型GLM-OCR。该模型参数量仅为0.9B,凭借自研CogViT视觉编码器,在权威榜单OmniDocBench V1.5中以94.6分登顶,性能比肩Gemini-3-Pro,并在公式、表格识别等领...
开发者发布了开源 API 管理工具 ApiFlow,旨在成为 Postman 的免费替代品。该项目历时近一年开发,作者称得益于大模型辅助,大幅提升了开发效率。ApiFlow 定位为“AI First”,支持完全离线部署与 Docker,计划...
这份资源合集汇集了基于Dify与DeepSeek R1的实战开发教程,涵盖从本地私有化部署到复杂Agent构建的全流程技能。课程内容不仅包括DeepSeek R1与Ollama的整合部署,还详细演示了如何利用Dify工作流搭建金融分析、智能...
Mozilla 正在为 Firefox 浏览器引入新的隐私控制设置,旨在让用户完全掌控 AI 功能。随着浏览器集成 AI 成为行业趋势,Firefox 选择在设置菜单中添加开关,允许用户禁用本地及云端的人工智能生成服务。这一举措延续了 Fi...
本文记录了一次独特的技术尝试:利用海量算力对拥有万亿参数的超大模型进行微调,旨在赋予其生成幽默内容的能力。尽管在模型参数规模上达到了顶峰,但实际生成的笑话效果却被观众评价为“并不好笑”。这一实验生动地揭示了当前大语言模型的局限性:单纯依靠参...
近期,市场上涌现出大量价格极低的ChatGPT Plus代充服务,月费低至15元人民币,仅需用户提供账号Token即可完成充值。这一现象严重违背了OpenAI的全球统一定价策略。业内分析指出,此类低价服务极有可能涉及利用土耳其等特定地区的支...
智谱AI发布开源多模态OCR模型GLM-OCR,基于GLM-V架构构建,专为复杂文档理解设计。该模型引入多Token预测损失函数及强化学习,集成了CogViT视觉编码器与0.9B参数的高效解码器。在OmniDocBench V1.5评测中,...
Zig 编程语言近日宣布了 ‘zig libc’ 子项目的重大进展,旨在通过 Zig 标准库封装逐步替代传统的 vendored C 源文件。目前已成功删除约 250 个 C 源文件,并计划继续重构剩余的 2000 ...
全球最大的代码托管平台 GitHub 正在经历不同程度的服务中断和性能降级。根据 Hacker News 的讨论热度及 GitHub 官方状态页面的信息,此次故障波及范围较广,导致部分用户无法正常访问代码仓库、进行代码提交或拉取请求,甚至影...
拥有19年历史的开源间隔重复软件 Anki 宣布重大变革。创始人 Dae 因长期独木难支、身心俱疲,决定将项目运营权逐步移交给由社区成员创办的商业公司 AnkiHub。AnkiHub 承诺 Anki 核心将永久开源,不引入风投,并拒绝为了利...
OpenAI首席执行官Sam Altman在社交媒体宣布,为庆祝Codex App正式上线,公司将在未来两个月内对所有付费计划的API额度限制进行翻倍。同时,该应用也首次向免费用户和Go用户开放了访问权限。这一举措旨在通过大幅提升算力供给来...
开源协作平台 Mattermost 陷入了许可证合规风波。有开发者在 GitHub 上指出,其项目 LICENSE.txt 文件中使用了“May be licensed”(可能被许可)等模糊措辞,而非明确的开源协议条款,这违反了开源定义的清...
Shorlabs 是一个新兴的开源项目,旨在为 Python 和 Node.js 开发者提供类似 Vercel 的极简部署体验。该平台深度依托 AWS Lambda 架构,实现了真正的 Serverless 运行,即用户只需为实际计算时间付...
这是一款名为 PolliticalScience 的匿名每日投票应用,专注于捕捉特定时点的公众舆论。开发者采用最新的 .NET 10 Blazor 混合架构(Static SSR + Interactive Server)构建,展示了该框架...
普遍认为64位整数的极限是$2^{64}-1$,但最新研究表明,通过Lambda演算这一极简编程模型,我们可以在仅64位的代码空间内定义出远超“葛立恒数”的天文数值。文章详细对比了图灵机与Lambda演算在Busy Beaver游戏中的表现...