Qwen3.6实测:在受限硬件下MoE模型速度倍超Dense架构
近日一份关于 Qwen3.6 模型的基准测试显示,在 CUDA 核心与内存带宽受限的硬件环境下,Qwen3.6-35B-A3B(MoE 混合专家模型)的推理性能显著优于 Qwen3.6-27B(Dense 稠密模型)。在模拟线上流量的固定 ...
近日一份关于 Qwen3.6 模型的基准测试显示,在 CUDA 核心与内存带宽受限的硬件环境下,Qwen3.6-35B-A3B(MoE 混合专家模型)的推理性能显著优于 Qwen3.6-27B(Dense 稠密模型)。在模拟线上流量的固定 ...
近日,DeepSeek V4 版本的文档中推荐了一款名为 ‘Continue’ 的 VS Code 插件作为代码补全工具,引发了技术社区的广泛关注。尽管该插件在 GitHub 上颇受好评,但在 Linux.do 论坛...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
近日,一位开发者在技术社区分享了其尝试利用纯AI技术(提及GPT 5.4)快速构建APP的挫折经历。尽管利用AI迅速生成了颇具设计感的UI界面,但在将其转化为实际代码时,AI未能完美复刻视觉设计,开发过程并非想象中那般“一键生成”。该开发者...
Hacker News 上推荐了一个名为 Gova 的开源项目,这是一个专为 Go 语言设计的声明式 GUI 框架。尽管 Go 语言在后端和云原生领域极具统治力,但在原生桌面应用开发方面一直缺乏足够强大的工具支持。Gova 试图解决这一痛点...
该项目基于 AI 大神 Andrej Karpathy 的经典 YouTube 讲座“大型语言模型入门”制作。作者下载了讲座文字记录,利用“Claude Code”AI 编程工具直接生成了整个交互式网站(单 HTML 文件)。这不仅是一次对...
本文由前Twitter、Google和Snowflake基础设施工程师撰写,宣布成立初创公司Cambra。文章痛陈现代软件开发的“碎片化”痛点:由于依赖大量底层模型不兼容的组件,系统变得脆弱且难以维护。作者提出构建“连贯系统”的愿景,即通过...
近日,技术社区Linux.do上一篇关于DeepSeek新版本的讨论引发关注。作者高度评价该模型在“世界知识”层面的表现,认为其预训练技术实现了巨大突破,认知能力已超越Claude和GPT,直逼Gemini。相比之下,国内其他大模型多沉迷于...
近日,DeepSeek 团队成员在 GitHub 发布了 V4 版本的角色扮演与思考模式切换指南。该文档揭示了在 APP 专家模式及 API 中,通过特定的提示词指令(如【角色沉浸要求】或【思维模式要求】),可引导模型生成包含内心独白的“角...
据社区用户反馈,开发者现已无需复杂的配置文件修改,即可在Codex App、命令行终端(CLI)以及VSCode插件中直接调用“GPT-5.5”模型。实现方法非常简单:通过CC Switch或确认中转API已提供相应模型ID后,直接在终端修...
一位开发者在社区发起关于异步智能体工作流开发的讨论。他指出,在构建涉及大量耗时操作(如API调用后需等待10分钟获取结果)的智能体时,现有的低代码平台如Dify显得灵活性不足。该应用场景要求在长时任务处理中支持实时进度查看、结果判断及邮件通...
近日有用户展示了GPT在办公自动化领域的最新突破。在测试中,用户先让AI生成了一张单页PPT的设计图,随后要求AI将其“按照原样式改成一个可编辑的pptx文件”。结果显示,AI不仅成功生成了文件,且还原度极高,所有文字、排版和元素均可编辑。...
针对此前发布的 AI Agent 认证工具 `sig`,开发者推出了 V2EX Skill 实战案例。该脚本通过 `sig` 安全管理登录凭证,实现了包括浏览热帖、搜索内容、每日签到、帖子详情查看及回复等在内的多项功能,不仅展示了 AI A...
V2EX 用户反馈 Claude 调整了其使用限额的重置机制。不同于以往的固定时间点(如整点)重置,新规则将重置锚点设为上一周期第一条消息的发送分钟。这种动态计时的变化导致用户若不持续在线,很难无缝衔接上下个周期,从而无法充分利用每月或每周...
这是一款专为解决标签页囤积焦虑而生的浏览器插件。由云原生开发者基于实际痛点打造,TabRack 提供实时检索、自动分类和“稍后阅读”功能,旨在优化多标签页管理效率。其核心亮点在于接入 AI 生成摘要,帮助用户快速筛选长文信息,解决“收藏即吃...
KCase 是一款新兴的开源测试用例生成与管理平台,致力于解决复杂场景下的测试设计难题。该平台最大的亮点在于将直观的“脑图式”编辑与“AI 辅助生成”深度融合。用户不仅可以通过脑图进行可视化的节点拆分和优先级标记,还能利用内置 AI 围绕特...
本文深刻剖析了过去60年来企业知识管理系统屡战屡败的根本原因:决策者因过度规避风险,倾向于选择“熟悉”的供应商(如Microsoft)和技术栈(如Java/Postgres),而非真正“正确”的方案。从早期的专家系统、SharePoint到...
针对国内用户订阅 Claude、GPT、Gemini 等 AI 服务遇到的支付瓶颈,本文作者基于亲身踩坑经历,整理了一套从零开始的“境外支付”开通手册。文章解决了现有教程信息零散、关键避坑点缺失的问题,详细记录了护照办理、境外实体卡(如 G...
近日,DeepSeek V4 模型在一次逻辑测试中表现出色。当面对“容器R里有几个草莓”这一定义模糊的难题时,该模型没有像以往的大语言模型那样强行“过拟合”或产生幻觉给出答案,而是主动反问用户“R”的具体定义。这种“不懂会问”的交互方式,被...
近日有开发者在社区反馈,DeepSeek模型在处理一项复杂的字符串解码任务时出现异常,思考时间超过2分钟仍无任何输出,且Web端与API端均存在该问题。在同等测试条件下,GPT与豆包虽未给出正确答案,但能快速响应并给出结果,仅有Gemini...
一位开发者在 V2EX 上分享了对月之暗面最新推理模型 Kimi k2.6 的使用体验,评价并不理想。该用户指出,Kimi k2.6 的推理过程逻辑混乱,常陷入“无限自我否定”的死循环,效果不如 GLM-4;且在基础工程能力上翻车,无法识别...