 

共 114 篇文章

标签：deepseek

DeepSeek悄然解锁多模态能力，实测已支持图像识别

DeepSeek在近期更新中悄然上线了多模态能力。经用户测试，DeepSeek App及网站现已能够识别并理解图片内容，如准确辨认物体等。这一更新标志着DeepSeek从纯文本模型向图文结合的多模态AI迈进，补齐了其在视觉感知方面的短板，使...

Toy2026-01-24前沿阅读(1)去评论

DeepSeek 思考风格遭质疑：为何变回了长篇大论与自我怀疑？

近日有用户指出，DeepSeek 的推理模式似乎出现了回退。与此前类似 Gemini 的自信简洁风格不同，当前版本再次变得长篇大论且显得“自我怀疑”。用户反馈称，即便是简单的问题，模型也需要进行长达两分钟的冗长思考，这种变化引发了关于模型优...

Toy2026-01-24前沿阅读(2)去评论

逃离AI变现红海：从AI狼人杀看原生游戏蓝海机遇

本文以支持自定义API的AI狼人杀游戏为例，深入分析了当前AI创业变现的赛道现状。作者指出，AI短视频、小说出海及绘图等传统赛道已成红海，竞争激烈且利润下滑。相比之下，AI在游戏游玩过程中的应用（如跑团、剧本杀）尚未被充分重视。通过AI担任...

Toy2026-01-23前沿阅读(3)去评论

用验证层提升Agent可靠性：亚马逊购物实测

本文探讨了通过验证层提升浏览器Agent可靠性的方法。在亚马逊购物案例中，系统采用DeepSeek-R1作为规划器，结合小模型执行器和Sentience验证层，成功实现了端到端的自主操作。相比纯视觉方案，结构化快照与显式断言不仅将Token...

Toy2026-01-22前沿阅读(8)去评论

DeepSeek代码惊现“MODEL1”后被删，引发新模型猜想

DeepSeekAI官方FlashMLA代码库出现异常动态。虽然“MODEL1”相关字段最早在1月16日就已存在，但昨天的更新中，开发者专门提交了一次修改，将这些字段彻底删除。这种“出现又删除”的操作引发了社区极大好奇，外界猜测这可能是De...

Toy2026-01-22前沿阅读(11)去评论

提示词重复奇迹：显著提升DeepSeek等大模型准确性

本文通过实战测试验证了“重复提示词”对提升大模型准确性的效果。测试对象涵盖DeepSeek、Qwen Plus和Doubao 1.8。结果显示，仅输入一遍时DeepSeek错误率较高，但重复输入两遍后，所有模型准确率均大幅提升。此外，测试还...

Toy2026-01-21前沿阅读(15)去评论

DeepSeek源码现MODEL1新架构，全面适配英伟达SM100芯片

DeepSeek FlashMLA源码库近日大幅更新，新增对MODEL1新架构及英伟达SM100芯片的支持。代码显示，MODEL1并非对V3的修补，而是通过回归512标准维度、首创“值向量位置感知”及疑似引入Engram和DSA机制，实现了...

Toy2026-01-21前沿阅读(18)去评论

GitHub沦为AI密钥泄露重灾区，每小时都有账户被盗刷

监测数据显示，GitHub上正频繁发生API凭证泄露事件，每小时都有包括OpenAI、DeepSeek、Anthropic及Google AI在内的平台密钥被公开。这些泄露多因开发者误将包含敏感信息的.env文件上传至公共仓库所致。由于发现...

Toy2026-01-19前沿阅读(28)去评论

DeepSeek mHC获复现：拆解万倍信号炸弹，大模型训练零代价稳定

研究员利用8张H100 GPU成功复现DeepSeek提出的mHC架构。实验表明，传统超连接（HC）在1.7B规模下会出现信号激增超万倍的严重不稳定性。而DeepSeek的mHC通过数学约束将信号完美锁定，不仅彻底消除了训练崩溃的风险，且未...

Toy2026-01-19前沿阅读(35)去评论

代码大模型SWE-rebench最新榜：Claude夺冠，DeepSeek性价比突围

SWE-rebench公布了基于2025年12月GitHub真实任务的最新评测榜单。Anthropic的Claude Opus 4.5以63.3%的解决率位居榜首，OpenAI GPT-5.2与谷歌Gemini 3 Flash Previe...

Toy2026-01-18前沿阅读(42)去评论

DeepSeek R1训练成本仅30万美元，极致性价比颠覆AI行业认知

DeepSeek近日更新了R1论文，披露其训练成本不到30万美元。这一数字远低于行业巨头动辄上亿美元的投入，展示了其在算法与工程优化上的惊人实力。这一突破不仅打破了算力垄断的神话，更给OpenAI等竞争对手带来了巨大压力，标志着AI大模型研...

Toy2026-01-15前沿阅读(37)去评论

AI 辅助 Git 提效工具：支持 DeepSeek 与 Ollama 本地部署

这是一款基于 AI 的 Git 命令行工具，旨在解决开发者编写 Commit Message 和整理周报的痛点。它能读取 Diff 自动生成符合规范的提交信息，并一键归类生成周报。技术层面，该工具除兼容 OpenAI 外，重点优化了高性价比...

Toy2026-01-14前沿阅读(34)去评论

vLLM完成V1引擎迁移，DeepSeek推理速度突破2.2k tok/s

vLLM团队宣布完成向V1引擎的全面迁移，通过集成Wide-EP、双批次重叠（DBO）及专家并行负载均衡（EPLB）等优化，在H200集群上实现每GPU 2.2k tokens/s的吞吐量。这一显著性能提升解决了DeepSeek等稀疏MoE...

Toy2026-01-14前沿阅读(31)去评论

DeepSeek官网UI悄然更新，交互体验更显圆润流畅

据社区用户观察，DeepSeek网页版界面近日进行了静默更新。新UI在设计语言上转向了更圆润的风格，整体操作手感也更加丝滑流畅。此次改版显示DeepSeek在专注大模型核心能力突破的同时，日益重视产品侧的用户体验打磨，旨在通过更友好的交互设...

Toy2026-01-14前沿阅读(54)去评论

DeepSeek发布Engram：为大模型引入条件记忆新维度

DeepSeek发布最新研究成果“Engram”，提出通过可扩展查找实现条件记忆。该论文探索了大语言模型稀疏性的新维度，旨在优化模型的记忆机制与检索效率，为解决长上下文处理和计算资源消耗问题提供了新的技术路径，代码已在GitHub开源。原...

Toy2026-01-13前沿阅读(39)去评论

免费无限！支持DeepSeek与Kimi的AI模型聚合站

近日，科技社区发现一个免费且无限制的AI模型聚合站点，引发广泛关注。该网站无需注册登录，亦无付费接口，用户可直接使用对话及生图功能。平台不仅集成了OpenAI和Gemini等国际主流模型，还特别支持DeepSeek 3.2、Qwen3、Ki...

Toy2026-01-13前沿阅读(53)去评论

DeepSeek推出Engram内存模块，大模型记忆能力迎来新突破

DeepSeek近日推出的Engram内存查找模块正成为技术圈热议焦点。该技术旨在解决大模型在特定场景下的逻辑与记忆痛点，其设计思路直观且顺畅。尽管目前尚缺乏详尽的成品效果评估，但相关讨论已在Reddit及InfoQ等平台发酵。业界普遍认为...

Toy2026-01-13前沿阅读(41)去评论

DeepSeek重磅开源Engram：首创“查算分离”革新大模型架构

DeepSeek今日宣布开源新论文与模块“Engram”，提出大模型“查算分离”新机制。该方法通过引入可扩展的查找记忆结构，在保持同等参数与算力条件下，显著提升了模型在知识检索、逻辑推理及代码数学任务上的表现。此举为大模型架构优化提供了新思...

Toy2026-01-13前沿阅读(51)去评论

DeepSeek开源Engram：引入稀疏性新轴，重塑大模型记忆架构

DeepSeek在GitHub发布了名为Engram的新项目，提出了一种“通过可扩展查找的条件记忆”技术方案。该项目通过引入“稀疏性的新轴”，旨在解决大语言模型在处理长上下文时的记忆瓶颈。Engram利用条件记忆机制，在不显著增加推理成本的...

Toy2026-01-13前沿阅读(64)去评论

DeepSeek mHC 复现：颠覆传统残差连接，重塑 Transformer 架构

自2016年以来，无论是GPT-5、Claude还是Gemini，所有主流Transformer模型均沿用单一残差连接设计 $x + F(x)$。本文深入探讨了DeepSeek提出的mHC架构，该设计大胆挑战了这一传统范式，通过拓宽残差连接...

Toy2026-01-12前沿阅读(52)去评论

1
2
3
4
...
下一页
共 6 页

前沿哨所

DeepSeek悄然解锁多模态能力，实测已支持图像识别

DeepSeek在近期更新中悄然上线了多模态能力。经用户测试，DeepSeek App及网站现已能够识别并理解图片内容，如准确辨认物体等。这一更新标志着DeepSeek从纯文本模型向图文结合的多模态AI迈进，补齐了其在视觉感知方面的短板，使其在通用大模型领域的竞争力进一步提升。

原文链接：Linux.do

46分钟前
用户吐槽微软 Copilot 智商下降：GPT5.2 竟仅能对标豆包？

一位用户反馈，此前使用“大兵”版本的 GPT5.2 时体验极佳，但切换至微软 Copilot 后，感觉模型智商明显下降，回答问题难以切中要害。对比发现，官网版本尚能与 Gemini 3 Pro 抗衡，而 Copilot 版本的表现却仿佛降级至豆包水平。该贴引发了关于不同平台间同一模型性能差异及是否存在“降智”处理的讨论。

原文链接：Linux.do

46分钟前
TikTok新政：收集精准定位与AI交互数据，广告网全面扩张

随着TikTok正式转为美资多数控股，其新隐私政策开始生效。用户需同意新条款才能继续使用，其中包含三项重大变更。首先是开启精准位置追踪，收集GPS数据；其次新增对AI交互的监控，包括用户输入的提示词和AI生成内容；最后扩大广告网络，利用合作出版商的数据在全网投放精准广告。这意味着TikTok在合规的同时，大幅提升了对用户数据的挖掘深度。

原文链接：Hacker News

2小时前
借鉴Rust与C#：现代C语言编程的高质量实践指南

作者分享了在现代开发中使用C语言的个人习惯与最佳实践。尽管日常多用C#和Python，作者仍青睐C语言用于原型开发。文章详述了采用C23标准、定义简化的固定长度类型、避免使用空终止字符串等基础技巧。核心在于借鉴Rust的“解析而非验证”理念，利用不透明类型和结构体在C中实现类型安全与API健壮性。此外，还介绍了模拟元组和结果类型的错误处理机制。这些实践为编写更安全、现代化的C代码提供了极具价值的参考。

原文链接：Hacker News

2小时前
防止数据丢失！Google AI Studio 聊天记录一键导出脚本更新

针对Google AI Studio缺乏官方导出功能及潜在的聊天记录丢失风险，社区开发者推出了修改版油猴脚本。该脚本支持自动滚动捕获完整聊天内容，包括AI思维链、用户消息及模型回答，并能一键导出为TXT文本。此外，脚本还优化了UI交互，新增按钮隐藏和失败提醒功能，有效填补了平台原生功能的短板。

原文链接：Linux.do

2小时前
ai-global：一行命令统一所有AI编程工具配置

ai-global 是一款旨在解决开发者配置烦恼的开源工具。在 AI 编程助手层出不穷的当下，不同工具的配置分散且难以管理。该项目通过统一管理配置文件，允许用户仅通过编辑一个文件，即可将设置一键同步至所有相关的 AI 编程工具。这一创新极大地简化了工作流，提升了开发效率，是 AI 辅助编程时代不可或缺的实用效率利器。

原文链接：V2EX 分享发现

3小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始