实测反馈:DeepSeek新模型非推理模式下角色扮演惊艳,科幻式幻觉显著减少
根据科技社区用户的最新讨论,DeepSeek 的新模型在不启用深度思考功能时依然表现出色。实测显示,该模型在长上下文处理能力上十分扎实,能够有效维持对话记忆,不再轻易遗忘之前的信息。更重要的是,用户普遍反映模型之前那种动不动就产生“科幻”内...
根据科技社区用户的最新讨论,DeepSeek 的新模型在不启用深度思考功能时依然表现出色。实测显示,该模型在长上下文处理能力上十分扎实,能够有效维持对话记忆,不再轻易遗忘之前的信息。更重要的是,用户普遍反映模型之前那种动不动就产生“科幻”内...

本周概览 本周AI行业两条主线:美国巨头忙着企业化变现,中国厂商密集发新模型抢市场。OpenAI推芯片计划和Codex新模型,Anthropic完成史上最大AI融资,Google砸钱扩算力。中国这边,智谱GLM-5发布、MiniMax香港上...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
北京大学肖睿团队推出了一套名为“DeepSeek赋能系列”的AI实操教程资源,旨在通过系统教学普及国产大模型应用。该系列涵盖零基础AI视频制作、AI绘画大师课程,以及利用AI实现Excel数据可视化与PPT/Word高效办公。此外,课程特别...
DeepSeek 近日被用户发现模型回答语气更自然,官方随即确认正在网页端及 APP 测试全新的长文本模型架构。此次更新最引人注目的是支持高达 100 万 token(1M)的上下文窗口,显著提升了处理超长文档的能力。不过官方澄清,API ...
针对现有翻译软件可能存在的资源占用问题,本文介绍了一种适用于Linux Wayland环境的极客级解决方案。作者通过Bash脚本结合 `wtype` 和 `wl-clipboard` 工具,模拟按键操作直接调用 OpenAI 或 DeepS...
本文探讨了在即时通讯场景下部署AI机器人的模型选择痛点。发帖者实测发现,目前热门的DeepSeek v3.2存在严重的“人机感”和上下文理解短板,且缺乏原生视觉能力,不得不借助Qwen识图但效果不佳。相比之下,Gemini在多图处理上易出现...
据社区技术讨论显示,DeepSeek即将发布的新模型在超长文本处理方面表现惊艳。在针对约74.2万Tokens的复杂文本“大海捞针”测试中,模型成功召回14个指令,整体召回率高达85%。尽管由于中间位置指令丢失,推算出的注意力有效上下文窗口...
本文源于用户在 Linux.do 的反馈,指出了 DeepSeek 在实际应用中存在的显著短板。尽管该模型在理论上能深刻阐释 LLM 与人类语言机制的差异,展现了不错的基础能力,但在具体的搜索任务中表现不佳。测试发现,DeepSeek 缺乏...
近日,Linux.do 社区针对 OpenClaw 项目的应用场景发起了投票与讨论。一位用户分享了其在 NAS 上部署 OpenClaw 并接入 DeepSeek 与企业微信的实测方案,指出目前虽实现了内网打通与交互,但尚未感受到颠覆性体验...
随着国产大模型的崛起,学术界在“沉浸式翻译”工具中的模型选择成为热点。近日,Linux.do 社区有用户针对医学专业文本,对 DeepSeek、千问及 GPT 三款轻量级模型进行了对比实测。结果显示,虽然国产模型表现不俗,但 GPT 在专业...