DeepSeek新长文本模型实测:百万级上下文窗口细节表现惊艳
DeepSeek 近日推出了支持 1M 上下文的新大模型,用户实测显示其在超长文本处理上表现优异。测试者上传了 30 个 Markdown 文件(预估 27 万 Tokens),涵盖自创的 GSCU 设定集,并提出了五个针对细节的刁钻问题。...
DeepSeek 近日推出了支持 1M 上下文的新大模型,用户实测显示其在超长文本处理上表现优异。测试者上传了 30 个 Markdown 文件(预估 27 万 Tokens),涵盖自创的 GSCU 设定集,并提出了五个针对细节的刁钻问题。...
鉴于高性能编辑器Zed此前缺乏完整的反向代理方案,社区开发者近期推出了全新的Zed2Api工具。该项目选用以高性能和安全性著称的系统级编程语言Zig编写,旨在为用户提供一个轻量、高效的API代理服务。Zed2Api的出现填补了Zed生态中的...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
针对反复刷新网页查看信息的痛点,一位开发者正在打造名为“盯盯”的 AI 浏览器插件。与传统的云端监控服务不同,该插件直接在用户本地浏览器运行,利用用户的登录态和 IP 解决了复杂验证(2FA/SSO)及反爬虫(WAF)的问题。其核心创新在于...
近日,V2EX 社区开源了名为“cursor-agent-team”的项目,旨在解决传统多智能体系统中的核心痛点。在常规的多 Agent 架构中,由于信息在各独立智能体间传递,往往导致上下文记忆的碎片化与丢失。该项目提出了一种“单会话多角色...
xAI联合创始人、知名AI科学家Jimmy Ba近日确认已离开公司。他在社交媒体上发文表示,我们正处于迈向生产力百倍增长的时代,并做出了一个大胆预测:具备“自上而下自我改进循环”能力的AI系统可能会在未来12个月内开始运行。Ba强调,随着技...
开源项目 Foxel 迎来 v2 里程碑版本,定位由文件管理器升级为“AI 文件操作系统”。v2 版本核心亮点包括:重构完整的 RBAC 权限体系,支持多用户协作与精细化管控;引入强大的插件架构(.foxpkg),实现前后端功能的无限扩展;...
本文通过部署一个深色模式的极简摄影作品集网站,对比了DeepSeek最新模型、Kimi-K2.5与GLM-4.7的前端生成能力。测试结果显示,DeepSeek在代码生成上表现精准,直接输出完整HTML;Kimi-K2.5则利用Agent集群...
据用户反馈,DeepSeek 网页端近期调整了文件上传策略。此前,用户上传较大 txt 文件时系统会自动截断内容,导致信息丢失。而最新的测试显示,目前系统已支持完整上传约 1.63 MB(1669 KB)的文本文件,这一容量较此前提升了约 ...
来自Linux.do社区的用户对DeepSeek新模型进行了高强度的长文本“大海捞针”(Needle in a Haystack)测试。在确认模型支持1M上下文窗口后,测试者上传了近97.7万Token的文件且未被截断。实测结果显示,该模型...
近日,科技社区对 DeepSeek 上线的 1M 上下文能力进行了极限“大海捞针”测试。测试者将虚构的关键信息分别植入不同长度的《红楼梦》文本中,结果发现 DeepSeek 能够稳定处理约 70 万字的超长文本,并精准提取出包括虚构天文学家...
开发者推出了一款名为Structure Insight Web的轻量级开源工具,旨在解决AI模型评估中的数据预处理难题。该工具支持将项目文件夹或ZIP压缩包通过拖拽方式直接转换为单一TXT文本文件。这一功能对于测试DeepSeek等大模型的...
针对现有收费论文翻译插件价格昂贵的问题,开发者利用 AI 辅助编程推出了开源替代方案 EasyPaper。该工具不仅解决了 PDF 翻译中公式、图表排版混乱的行业痛点,还创新性地提供了“英译英”功能,将晦涩的学术词汇替换为简单易懂的日常用语...
该开源项目旨在将 QQ 消息通道基于 OneBot v11(推荐 NapCat)完整接入 OpenClaw AI 框架。与仅能实现基础对话的 Demo 不同,该插件主打“生产可用”,解决了长期稳定运行中的痛点。关键特性包括支持全类型消息(私...
在利用大语言模型进行高强度“vibe coding”(AI辅助编程)时,开发者普遍面临一个棘手问题:由于模型训练数据的滞后性,AI常推荐已过期或废弃的代码库,导致运行报错。这不仅阻碍了开发效率,也暴露了通用大模型在处理实时技术栈时的局限性。...
DeepSeek发布了其新模型的核心能力升级,底层技术实现大幅跨越。新模型在逻辑推理上表现更优,能清晰拆解复杂问题;代码能力显著增强,覆盖编写、Debug及算法解题。此外,模型支持百万级Token长文本输入,信息定位精准,多轮对话记忆更持久...
继移动端之后,DeepSeek 似乎正在网页端灰度测试 1M token 的超长上下文能力。用户在开启“深度思考”模式后测试发现,模型自述上下文窗口已达 1M,且知识库更新日期延续至 2025 年 5 月。若属实,这将标志着 DeepSee...
据社区用户反馈,DeepSeek官网及APP已悄然启动新模型的灰度测试。此次更新核心亮点在于将上下文窗口大幅提升至100万tokens(1M context),这将显著增强模型处理超长文本、复杂代码库分析及长对话记忆的能力。同时,新模型配备...
Golioth发布的Signy项目针对资源受限的物联网设备提供了全新的安全通信范式。传统方案往往要求MCU在本地执行繁重的加密运算,这对算力和内存都是巨大挑战。Signy利用“签名URL”技术,将验证过程转移至服务端,设备端仅需发起标准HT...
一位编程小白分享了使用“Vibe Coding”从零开发安卓打卡App的实战经历。作者对比了Trae(搭载GLM-4)与Google Antigravity(搭载Gemini)的表现,发现虽然国产模型能完成基础构建,但在修复深层Bug和UI...
近期许多开发者在使用 Claude Code 时遭遇 Bash 命令执行卡顿,问题根源并非终端本身,而是后台用于话题检测和结果总结的 `small_fast_model`。该模型一旦触发深度思考或接口延迟,会直接阻塞主流程。解决方案是将环境...