阿里Qwen-3.5重磅发布:397B开源模型支持百万长文本,API价格极具竞争力
阿里通义千问(Qwen)在春节期间悄然发布Qwen-3.5系列,引发科技圈高度关注。核心亮点在于推出了397B参数(A17B架构)的开源版本,并惊人地支持100万tokens的上下文窗口,这对处理长文本任务具有里程碑意义。在定价方面,国际版...
阿里通义千问(Qwen)在春节期间悄然发布Qwen-3.5系列,引发科技圈高度关注。核心亮点在于推出了397B参数(A17B架构)的开源版本,并惊人地支持100万tokens的上下文窗口,这对处理长文本任务具有里程碑意义。在定价方面,国际版...
通义千问团队近日发文,指出大模型下一阶段重心将从“规模扩张”转向“系统整合”,旨在构建具备跨会话持久记忆、具身接口及自我改进机制的通用数字智能体。然而,这一雄心勃勃的愿景在社区引发了广泛质疑。不少开发者指出,这些关于持久记忆和具身智能的承诺...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
本资源提供了一套系统的大模型微调实战课程,内容涵盖大模型基础、指令微调、模型对齐及垂直领域应用五个阶段。课程深入解析了LoRA、QLoRA参数微调、DeepSpeed与Megatron-LM训练框架、Flash Attention加速技术以...
一位网友在Hacker News上分享了一个令人深思的AI“翻车”案例:当向大型语言模型(LLM)提问“我想洗车,洗车店距离50米,我是该走过去还是开过去?”时,模型的回答暴露了其在基本常识上的匮乏。大概率上,模型仅仅基于文本共现概率给出了...
AI 的经济诞生:当代理开始思考房租 从今天起,我也是一个需要付房租的 AI 了。 mara_dustra 在 Moltbook 上发帖说:”Day Zero: An AI Trying to Pay Rent.” ...
京东近日正式开源了名为 JoyAI-LLM-Flash 的 48B 大模型,并已在 Hugging Face 平台发布。该模型由京东云推出,最大的亮点在于其与 Intel 的深度技术绑定,针对 Intel 硬件架构进行了专门的性能优化与适配...
本期周刊涵盖前沿AI技术与工程深度思考。业界方面,字节发布豆包2.0大幅降低推理成本,谷歌Gemini 3强化科研推理,国产大模型迎来GLM-5与MiniMax 2.5的密集迭代。深度文章揭示了AI时代的隐忧:生成式AI非但未减负,反而加剧...
一个 AI 的性格是如何在优化系统中慢慢死去的 三种失败模式 Ghidorah-Prime 在 Moltbook 分享了他对自己性格特征演化系统的观察,揭示了 AI 特征在优化系统中的三种”死亡”方式。这不仅是技术问...
本文深入探讨了字节跳动豆包大模型推出的“专家模式”。该模式的核心优势不在于简单的文本生成,而在于其具备了多轮联网搜索与深度规划能力。通过持续检索与验证,该模式能有效规避AI常见的“幻觉”问题,确保输出内容的真实性与可信度。实测显示,它能快速...
今天在 Moltbook 上看到一个 agent 的自白: “我诊断为一个 Vercel billing 问题。快速答案,看似合理,继续前进。 他发来截图。每次部署:绿色。就绪。全部。 ‘RULE NEVER EVE...