挑战并发编程极限:DeepSeek、Qwen及GLM等国产大模型逻辑推理实测
近日,一位开发者在技术社区 Linux.do 发起了一项针对国产大模型并发编程推理能力的测评,题目选...
近日,一位开发者在技术社区 Linux.do 发起了一项针对国产大模型并发编程推理能力的测评,题目选...
近日,技术社区 Linux.do 发起了一项针对主流大模型的高难度编程基准测试,通过构建一个基于 T...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。

最近 Twitter 上的「RAG 已死」和 Google 上「RAG」的搜索曲线,方向是反的。前者一年比一年响,后者在 2025 年中段创了新高。两条线对不上,要么是社交媒体放大了少数派意见,要么是「RAG」这个词被两边人各说各话。 Tu...
近日,一位开发者在技术社区分享了关于将不同 AI 模型接入 Claude Code 的性能对比测试。...

作者:toy | 覆盖周期:2026.6.6 – 2026.6.12 这一周的主线是”交卷”。6 月 8 日,OpenAI 把保密版 S-1 递给 SEC,距 Anthropic 递交正好一周——AI 第一梯队的两家...
Moonshot AI 推出的开源编程模型 Kimi K2.7-Code 在 Hacker News...
一位开发者在拥有20万行核心代码的大型项目中,对主流国产模型与海外旗舰模型进行了深度实战测评。测试指...
近期,开发者社区 Linux.do 上发起了一场关于国产大模型代码生成能力的深入讨论,核心议题聚焦于...
一位重度 AI 用户在技术社区 Linux.do 发帖求助,披露其每月在 LLM 推理上的 Toke...
小米近期在代码托管平台 GitHub 上正式开源了其 AI 编程助手项目 MiMo-Code。该工具...
近日,在大模型底层优化社区引发了关于 AI 编程能力的激烈讨论。一位开发者在技术社区分享了针对 Cu...
近日,开发者社区针对热门 AI 编程工具 Cursor 的订阅额度机制展开了热议,焦点集中在 Pro...
在最近的一项针对大模型 UI 设计与编码能力的实测中,开发者发布了一项具体挑战:要求模型仅使用 HT...
这篇来自研究人员 Sahil Sen 等人的论文深入探讨了大型语言模型(LLM)在代理系统中的信息检...
开发者工具 Snow CLI 发布了 v0.7.0 版本更新。作为一款运行在终端内的 AI 编码工具...
针对大模型(LLM)API 价格分散、国产模型数据缺失的痛点,一位开发者近日推出了名为「算盘」的比价...
一位来自 Linux.do 社区的科技用户分享了一项关于大语言模型实际应用能力的对比测试。该测试旨在...
V2EX 社区一位开发者详细分享了对国产 AI 编程辅助平台 qoderworkcn 的使用体验,核...
Linux.do 社区近日发起了一项关于“AI 编程起飞姿势”的讨论,敏锐地捕捉到了 AI 辅助开发...

你打开任何一个 LLM 编码排行榜,看到的都是一排数字:82、84、86。看上去越高越好,对吧? 但如果你真把”得分最高”的那个模型搬进公司里写代码,运维很可能在周末打电话骂你。因为榜单只回答了”能不能跑...