共 607 篇文章

标签：deepseek 第35页

硬核玩家晒双路RTX 5090 AI工作站：全栈部署DeepSeek与Qwen模型

一位技术发烧友在 Linux.do 社区展示了其基于双路 RTX 5090 显卡和至强 W7 处理器的顶级本地 AI 工作站部署方案。该系统在 Ubuntu 22.04 环境下，利用 vLLM 框架成功运行了 Qwen3-32B、DeepS...

赞(0)

Toy2026-03-19前沿阅读(209)

纵向PDF转码成盲区：WPS失灵，DeepSeek与豆包也难以招架

一位科技爱好者在Linux.do社区发帖求助，指出处理东亚纵向排版（竖排文字）的PDF文档依然是当前软件和AI的痛点。经实测，WPS等传统办公软件在转换时会出现乱码；而DeepSeek、豆包等头部国产大模型也未能幸免，只能识别出部分文本，无...

赞(0)

Toy2026-03-18前沿阅读(118)

阿里云全线云产品特惠 · 一站采购

ECS / OSS / CDN / 云数据库一站采购,常用云资源集中选配;新用户与续费均有专场优惠,适合个人开发者与小团队长期使用。

2026-08-02

技巧分享：利用Nginx反向代理，让Trae客户端无感接入第三方模型

本文介绍了一种无需安装额外软件即可让 AI 开发工具 Trae 使用第三方模型（如 DeepSeek）的技巧。通过搭建 Nginx 反向代理服务器，配合 mkcert 生成的本地 CA 证书，用户可以修改本机 hosts 文件，将 Trae...

赞(0)

Toy2026-03-18前沿阅读(565)

移花接木被识破？日本乐天RakutenAI 3.0被指基于DeepSeek且删改许可证

日本乐高调发布宣称性能优异的RakutenAI 3.0模型，却被社区抓包其实质是基于中国DeepSeek V3架构。更具争议的是，乐天被指故意删除了DeepSeek原本的MIT开源协议文件，试图掩盖“套壳”事实；在社区质疑声四起后，虽被迫重...

赞(0)

Toy2026-03-18前沿阅读(191)

实测五款国产大模型：字节豆包在空间理解与轨迹规划中意外夺冠

本文基于物理轨迹生成的科研需求，通过400次蒙特卡洛仿真实验，对DeepSeek-V3、Qwen2.5、GLM-4.5、字节豆包及MiniMax五款主流国产大模型的空间理解能力进行了严格测评。测试涵盖了2D及3D环境下的多障碍物规避与轨迹连...

赞(0)

Toy2026-03-17前沿阅读(189)

告别“文档地狱”：一款集成 DeepSeek 的开源 AI 工具可一键生成软著代码及全栈文档

V2EX 社区分享了开源项目 ‘delier-helper’，该工具集成了 DeepSeek 和 Google 等 AI 模型，旨在解决开发者撰写各类技术文档的痛点。其功能覆盖了软件著作权申请所需的代码生成、接口文档...

赞(0)

Toy2026-03-17前沿阅读(113)

开源自托管笔记 Nowen Note 发布：接入 DeepSeek/Ollama AI，支持 Docker 一键部署与 RAG 知识库

开发者推出了一款名为 Nowen Note 的开源自托管知识库应用，旨在成为群晖 Note Station 的开源替代方案。该项目采用前后端分离架构，支持 Docker 一键部署，确保用户数据完全私有化。核心功能方面，Nowen Note ...

赞(0)

Toy2026-03-17前沿阅读(287)

大模型、蒸馏、MoE：一篇讲人话的 AI 科普

你可能经常看到”大模型””蒸馏””MoE”这些词。它们到底是什么？为什么 DeepSeek 能用六分之一的成本干翻硅谷？为什么 Anthropic 说中国公司在R...

赞(6)

Toy2026-03-17AI 阅读(862)

覆盖Sora与DeepSeek等热门工具，这套AI实战教程汇集九大应用场景

本资源汇集了一套完整的AI实战视频教程，包含19个文件，涵盖了当前最热门的AI应用场景。内容从视频生成（可灵、Sora）到日常办公（WPS AI、Napkin），再到教育辅助（豆包、老师帮）及创意设计（DeepSeek文案、创客贴海报）。教...

赞(0)

Toy2026-03-16前沿阅读(97)

AI 架构全景图：汇总 DeepSeek、Llama 3 与 Kimi 等主流大模型技术细节

该资源库汇集了当前最前沿的开源大语言模型架构图与详细参数表，由 AI 专家 Sebastian Raschka 整理发布。内容不仅涵盖了 Meta Llama 3、DeepSeek V3/R1、Mistral 等国际主流模型，还重点收录了包...

赞(0)

Toy2026-03-16前沿阅读(169)

上一页
1
···
32
33
34
35
36
37
38
...
下一页
共 61 页

事件分析

此次事件揭示了 AI 训练数据供应链中一个极其隐蔽但危害巨大的盲区：数据的“不可撤销性”与“镜像放大效应”。不同于可以通过强制推送撤销的 Git 历史，一旦敏感密钥进入公共训练语料库，它会被无数次复制、混入衍生数据集并最终固化为模型权重。扫描显示，44% 的泄露密钥出现在多个数据集中，部分来自 The Stack 或 Common Crawl 等上游源头，这种污染具有机械放大的特性。技术上，除了传统的 GitHub 泄露，聊天机器人交互日志已成为新的密钥泄露源头，开发者将含有凭证的代码粘贴给 AI 助手进行调试，导致凭证被捕获并扩散。对于产业而言，这迫使 AI 开发者必须引入“秘密扫描”作为数据清洗的标准前置步骤。未来，开源模型的信誉将不再仅基于性能指标，还需基于其数据集的“卫生”状况，未经审计的公共数据集可能会面临严格的准入限制。

💡 核心观点：训练数据的不可逆性使密钥泄露成为永久性隐患，AI 供应链亟需建立“清洁数据”标准。

事件分析

从技术层面分析，用户产生“误用”且体验优于原定模型的现象，主要归功于 DeepSeek 在推理优化和响应延迟上的突破。DeepSeek 近期发布的模型在架构上进行了深度优化，特别是在处理长上下文和复杂逻辑时，首字生成时间（TTFT）和吞吐量往往能带来更流畅的交互感。这种“无感切换”证明了在通用任务场景下，开源系或技术流模型的体验已经能够比肩甚至在特定维度超越闭源头部产品。关于“Pro版灰度测试”的猜测，也暗示了厂商在模型服务端的动态部署策略（AB Test 或动态路由），旨在通过实际负载检验高参数量模型的边缘能力。对于产业而言，这标志着大模型竞争已进入“体验为王”的阶段，单纯的营销噱头正逐渐让位于真实的生成速度与逻辑准确性。

💡 核心观点：用户“误用”模型后的体验反转，标志着国产大模型已跨越技术感知的临界点，性能与体验的实质差距正在抹平。

事件分析

这款工具的推出反映了 AI 辅助编程从单点试用向规模化、工程化应用演进的趋势。随着 Claude Code 等 AI 编程 agent 逐渐深入开发流程，如何高效管理多个并发会话、维护上下文连续性以及控制 API 成本成为新的痛点。Episko 选择 Rust 开发，表明开发者对管理工具的性能、安全性和资源占用有较高要求，这也是目前基础设施类工具的主流技术选择。工具中的成本预测和 token 消耗监控功能，直指 LLM 应用落地中的核心——成本效益。它不仅是一个便利工具，更是 AI 时代的“仪表盘”，预示着未来开发环境将更加深度地与 AI 模型交互层融合，专门针对 AI Agent 的编排和管理（Orchestration）将成为独立于 IDE 之外的新赛道。

💡 核心观点：从 IDE 插件到独立“驾驶舱”的演进，标志着 AI Agent 开发正进入需精细化成本控制与上下文管理的专业化新阶段。

事件分析

本事件的技术核心在于商业平台对去中心化协议的“流量截留”与“入口控制”。RSS 允许用户直接获取内容，绕过算法推荐与广告分发，这与 Google 基于广告变现的商业模式存在根本冲突。通过收购并废弃关键的 RSS 基础设施，Google 成功将信息消费导向其封闭的围墙花园。这种策略表明，开放协议若缺乏多元化的基础设施支持，极易被单一巨头“扼杀”。Google Reader 的关闭导致了 RSS 生态长达数年的断层，也警示开发者依赖单一商业实体的开源项目所面临的风险。当前，随着对算法控制的反思，RSS 的复兴趋势正在形成，但这要求技术社区必须构建独立于科技巨头、抗审查且去中心化的新一代内容聚合基础设施。

💡 核心观点：谷歌对RSS的打压揭示了科技巨头通过控制流量入口来瓦解开放协议的根本动机，即牺牲开放性以换取算法推荐与广告变现的垄断利益。

事件分析

此次事件揭示了形式化验证工具在 AI 辅助编程时代面临的新型挑战。虽然 Lean 等系统旨在构建绝对可信的数学与代码逻辑基础，但其内核实现（尤其是对复杂类型的处理）仍存在被攻破的可能。AI 在此事件中扮演了“双刃剑”的角色：它既生成了利用漏洞的复杂逻辑，也可能成为未来测试内核健壮性的有效工具。对于数学软件和编译器开发而言，这意味着单纯的逻辑正确性已不足以保证系统安全，必须引入更严格的模糊测试和对抗性测试，以防御 AI 生成的边缘案例攻击，确保形式化证明的绝对可靠性。

💡 核心观点：AI 不仅是编程助手，更能充当高级“模糊测试器”，挖掘形式化工具深处的逻辑盲区。

事件分析

此事件体现了提示词工程在优化大模型落地应用中的关键作用。目前的通用大模型虽具备强大的语言处理能力，但在翻译任务中常受限于训练数据的分布特征及RLHF对齐策略，倾向于生成四平八稳但缺乏个性的“机器腔”。用户通过设计包含角色定义、行为边界及否定约束的复杂提示词，实际上是在调用大模型的上下文学习能力，通过显式的逻辑规则覆盖了模型默认的生成偏好。

该提示词中的“语境自适应”与“句法重构”模块，模拟了人类高级翻译的思维过程，即先理解文体再进行转换。这表明，不需要对模型参数进行微调或重新训练，仅需在推理阶段注入高质量的“思维链”，即可显著改善模型的表现。这种通过提示词挖掘模型“潜力”而非“能力”的方式，对于未来构建更具专业性的AI Agent或辅助工具有重要的借鉴意义，特别是在写作辅助、代码转换及跨语言沟通等对语言质感要求较高的场景中。

💡 核心观点：通过精细化的结构化提示词，可有效矫正大模型的“翻译腔”通病，低成本挖掘通用模型的垂直潜力。

标签：deepseek 第35页

硬核玩家晒双路RTX 5090 AI工作站：全栈部署DeepSeek与Qwen模型

纵向PDF转码成盲区：WPS失灵，DeepSeek与豆包也难以招架

阿里云全线云产品特惠 · 一站采购

技巧分享：利用Nginx反向代理，让Trae客户端无感接入第三方模型

移花接木被识破？日本乐天RakutenAI 3.0被指基于DeepSeek且删改许可证

实测五款国产大模型：字节豆包在空间理解与轨迹规划中意外夺冠

告别“文档地狱”：一款集成 DeepSeek 的开源 AI 工具可一键生成软著代码及全栈文档

开源自托管笔记 Nowen Note 发布：接入 DeepSeek/Ollama AI，支持 Docker 一键部署与 RAG 知识库

大模型、蒸馏、MoE：一篇讲人话的 AI 科普

覆盖Sora与DeepSeek等热门工具，这套AI实战教程汇集九大应用场景

AI 架构全景图：汇总 DeepSeek、Llama 3 与 Kimi 等主流大模型技术细节

置顶推荐

前沿哨所

震惊：扫描7.6PB HuggingFace数据竟发现22万个有效密钥，AI供应链面临安全风暴

事件分析

社区实测反馈：DeepSeek 意外“平替” Kimi，推理速度与响应质量获用户好评

事件分析

开源工具 Episko：用 Rust 为 Claude Code 打造的 Agent 管理驾驶舱

事件分析

谷歌如何系统性瓦解RSS：从“拥抱、扩展、毁灭”看开放协议的衰退

事件分析

Lean 内核漏洞复盘：AI 辅助生成 Collatz 猜想“伪证”始末

事件分析

告别AI翻译腔：用户分享专属豆包的“王牌翻译家”提示词工程

事件分析

最新文章

热门专题

热门标签

网站统计