DeepSeek长文本能力实测:成功通过百万Token“大海捞针”测试
来自Linux.do社区的用户对DeepSeek新模型进行了高强度的长文本“大海捞针”(Needle in a Haystack)测试。在确认模型支持1M上下文窗口后,测试者上传了近97.7万Token的文件且未被截断。实测结果显示,该模型...
来自Linux.do社区的用户对DeepSeek新模型进行了高强度的长文本“大海捞针”(Needle in a Haystack)测试。在确认模型支持1M上下文窗口后,测试者上传了近97.7万Token的文件且未被截断。实测结果显示,该模型...
近日,科技社区对 DeepSeek 上线的 1M 上下文能力进行了极限“大海捞针”测试。测试者将虚构的关键信息分别植入不同长度的《红楼梦》文本中,结果发现 DeepSeek 能够稳定处理约 70 万字的超长文本,并精准提取出包括虚构天文学家...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
开发者推出了一款名为Structure Insight Web的轻量级开源工具,旨在解决AI模型评估中的数据预处理难题。该工具支持将项目文件夹或ZIP压缩包通过拖拽方式直接转换为单一TXT文本文件。这一功能对于测试DeepSeek等大模型的...
DeepSeek发布了其新模型的核心能力升级,底层技术实现大幅跨越。新模型在逻辑推理上表现更优,能清晰拆解复杂问题;代码能力显著增强,覆盖编写、Debug及算法解题。此外,模型支持百万级Token长文本输入,信息定位精准,多轮对话记忆更持久...
继移动端之后,DeepSeek 似乎正在网页端灰度测试 1M token 的超长上下文能力。用户在开启“深度思考”模式后测试发现,模型自述上下文窗口已达 1M,且知识库更新日期延续至 2025 年 5 月。若属实,这将标志着 DeepSee...
据社区用户反馈,DeepSeek官网及APP已悄然启动新模型的灰度测试。此次更新核心亮点在于将上下文窗口大幅提升至100万tokens(1M context),这将显著增强模型处理超长文本、复杂代码库分析及长对话记忆的能力。同时,新模型配备...
2026年2月,社区用户在测试DeepSeek APP时发现一个异常细节:端模型在对话中自称知识库截止到2025年5月,甚至知道OpenAI还没发布的”o4 mini”。同时,系统显示最高支持100万token上下文...
近日,一个开源的多AI角色群聊项目在技术社区引发关注。该项目旨在测试不同大模型的智能协作与博弈能力,但在演示的“谁是卧底”游戏中,出现了DeepSeek模型投票给自己、Qwen模型逻辑异常等滑稽场面。这一“赛博斗蛐蛐”的现象虽然幽默,但也深...
这是一份极具价值的全链路大模型技术实战资源,涵盖了从底层原理到前沿应用的全过程。教程首先深入浅出地讲解了词向量、Transformer架构及注意力机制等核心理论;随后通过BERT、ERNIE等案例巩固NLP基础。尤为珍贵的是,课程紧跟技术潮...
据Hugging Face最新合并的代码请求显示,智谱AI下一代模型GLM-5在架构上进行了重大调整,不再沿用旧路线,而是全面复用了DeepSeek-V3的DSA稀疏注意力机制与多标记预测(MTP)技术。GLM-5采用78层Transfor...