 

共 114 篇文章

标签：deepseek 第3页

newapi更新参数覆盖功能，增强AI模型操作灵活性

newapi近日发布了参数覆盖功能的更新，进一步增强了语义操作能力，使开发者能够更方便地进行批量参数移除、增加和替换操作。例如，在处理DeepSeek模型时，可通过条件逻辑自动添加thinking参数，并移除模型后缀。官方提供了详细的代码示...

Toy2026-01-03前沿阅读(37)去评论

DeepSeek论文揭示mHC机制：类比人脑神经稳态调节

DeepSeek最新论文提出mHC机制，通过强制信号归一化（Sum=1）实现全局能量守恒，防止信号放大或消失。该机制类比人脑神经突触的稳态调节，确保网络复杂度下信号稳定。Gemini分析指出，mHC类似突触受体数量调节，避免癫痫式爆发或死寂...

Toy2026-01-02前沿阅读(42)去评论

DeepSeek发布mHC架构，提升AI训练稳定性

中国AI初创公司DeepSeek于2026年初发布技术论文，介绍流形约束超连接(mHC)深度学习架构。该架构解决了神经网络规模扩大时的训练不稳定性和可扩展性问题，由创始人梁文锋团队研发，声称提供切实的性能改进和卓越的可扩展性。业内观察人士认...

Toy2026-01-02前沿阅读(37)去评论

Navi插件：AI对话快速跳转神器

Navi是一款Chrome插件，专为解决AI长对话中的痛点设计。用户在ChatGPT、Gemini等平台进行深度交流时，常因对话冗长而难以快速定位问题。Navi通过目录管理功能，实现一键跳转，显著提升效率。支持主流AI工具，包括ChatGP...

Toy2026-01-02前沿阅读(47)去评论

中国开源AI模型IQuest-Coder-V1 40b超越Claude 4.5

今日，中国量化私募九坤投资至知研究院宣布开源IQuest-Coder-V1系列40b模型，该模型声称在性能上超越了知名AI模型Claude 4.5。这一事件引发广泛关注，被视为可能成为类似DeepSeek的突破性时刻。开源社区已展开热烈讨论...

Toy2026-01-01前沿阅读(36)去评论

免费AI API无需密钥：DeepSeek R1与TinyLlama服务上线

mlvoca平台推出免费LLM API服务，支持DeepSeek R1（1.5b）和TinyLlama模型，无需API密钥即可使用。该API采用Ollama格式，提供POST /api/generate接口，便于开发者快速集成文本生成功能。...

Toy2026-01-01前沿阅读(37)去评论

DeepSeek发布新论文：提出mHC架构，梁文锋领衔研发

DeepSeek在年初发布重磅论文，提出全新mHC架构。论文第一作者为解振达、韦毅轩、曹欢琪，创始人兼CEO梁文锋也在作者名单中，凸显公司对技术创新的重视。作为AI领军企业，DeepSeek的这一新架构或在模型优化和芯片领域带来突破，有望推...

Toy2026-01-01前沿阅读(40)去评论

DeepSeek发布mHC论文：约束超连接优化AI模型

DeepSeek团队近日发布了新论文mHC: Manifold-Constrained Hyper-Connections，该研究扩展了AI模型中的残差连接范式。通过扩大残差流宽度和多样化连接模式，mHC技术旨在优化模型性能，可能推动AI架...

Toy2026-01-01前沿阅读(45)去评论

至知研究院开源代码大模型IQuest-Coder-V1，刷新SWE-bench纪录

2025年跨年之际，国内量化巨头九坤投资发起的至知研究院发布开源代码大模型IQuest-Coder-V1系列。该模型在SWE-bench权威评测中以81.4%的成绩刷新开源模型纪录，采用创新的Code-Flow训练范式，通过学习代码库历史演...

Toy2026-01-01前沿阅读(40)去评论

AI 驱动电子书阅读：DeepSeek 智能体验升级

本文分享了在电子书阅读器 Reeden 中利用 DeepSeek AI 模型进行辅助阅读的探索。作者详细描述了五种实用场景，包括回忆人物背景、获取剧情剧透、总结章节要点、查词解释和翻译单词。在实现技术上，作者比较了 RAG 向量库和普通文本...

Toy2025-12-30前沿阅读(40)去评论

DeepSeek App悄然上线语音识别，疑用自研ASR技术

DeepSeek App在手机端最新版本悄然上线了语音识别功能，支持语音转文字。用户在Linux.do论坛讨论中提到，DeepSeek发布的模型中似乎没有语音识别能力，因此推测该功能可能采用了公司未公开的自家语音识别ASR技术。这一更新可能...

Toy2025-12-30前沿阅读(86)去评论

DeepSeek配置失败：Linux用户遭遇运行超时难题

一名用户在Linux环境下按照DeepSeek官网指南进行配置后，遭遇持续运行超时问题。用户尝试两天仍未解决，质疑是否必须使用梯子或存在配置错误。此问题引发社区讨论，反映了AI工具在实际部署中的技术挑战，尤其对开发者而言，凸显了优化部署指南...

Toy2025-12-30前沿阅读(32)去评论

AI幻觉测试：Gemini 3和Claude Opus 4.5领先

Naver推出开源模型HyperCLOVA X SEED Think，在artificialanalysis站点得分仅44分，接近韩国模型EXAONE 4.0 32B；国产Deepseek R1得分52分；基于AA-Omniscience指...

Toy2025-12-29前沿阅读(39)去评论

HUBAGI API价格大跳水，AI模型折扣高达85%

HUBAGI平台近期推出大幅折扣API服务，官方稳定渠道DeepSeek V3.2、ViduQ2、Gemini 2.5 pro/3.0 pro/flash等模型均享4折优惠。逆向渠道更推出0.15一刀的Gemini和Claude模型，以及0...

Toy2025-12-29前沿阅读(32)去评论

拼好AI：轻量级LLM API网关开源发布

拼好AI是一个专为个人用户设计的开源LLM API网关，旨在整合多个AI服务提供商的API，如OpenAI、Anthropic等。项目采用前后端分离架构，支持Docker快速部署，提供Web管理界面，兼容OpenAI和Anthropic格式...

Toy2025-12-29前沿阅读(36)去评论

DeepSeek驱动的英语翻译插件开源：AI赋能个性化翻译工具

一位开发者基于个人需求，从课后作业出发，开发了英语翻译插件。该插件利用DeepSeek AI API，提供单词模式（音标、释义、词源故事、例句、AI推荐图片）和句子模式（流畅整句翻译），并通过Python后端自动抓取Bing图片辅助视觉记忆...

Toy2025-12-29前沿阅读(31)去评论

Gemini 3 Pro在解密游戏中现无限循环问题

用户在使用Google的Gemini 3 Pro AI模型尝试解决解密游戏Cogito Ergo Loot时，遭遇了异常行为：AI不仅暴露了思考过程，还陷入无限循环，持续输出“(End) Response”，导致token消耗激增。为避免资...

Toy2025-12-28前沿阅读(38)去评论

大模型使用手册：从GPT到国产全家桶-Toy's Tech Notes

大模型使用手册：从GPT到国产全家桶

大模型使用手册：从GPT到国产全家桶一、问题选型困境： – 市面上几十个大模型,怎么选? – GPT-4贵,国产便宜,性能差多少? – 写代码用哪个?翻译用哪个? 核心疑问：不同模型的能力边界在哪? ...

Toy2025-12-26实战阅读(43)去评论

国产编程模型：Kimi与DeepSeek领跑

在科技论坛Linux.do上，一篇关于国产编程模型的讨论引发关注。文章指出，GLM和minimax正在冲刺IPO，宣传力度强劲，但模型参数量成为其短板，相比之下，Kimi和DeepSeek以低调可靠著称。作者强调，在国产模型中，Kimi和D...

Toy2025-12-26前沿阅读(36)去评论

BetterPrompt开源：AI提示词智能优化工具

BetterPrompt是一款开源的AI提示词优化工具，旨在解决开发者在日常工作中需要反复优化提示词的痛点。该工具提供Web界面，支持一键优化提示词并输出中英文版本，特别内置了DeepSeek免费API，降低使用门槛。开发者无需再手动复制提...

Toy2025-12-26前沿阅读(41)去评论

上一页
1
2
3
4
5
6
下一页
共 6 页

前沿哨所

Claude 需求过热？Antigravity 宣布将 Pro 配额调整为 2 天一更

AI 聚合平台 Antigravity 近日宣布调整 Pro 版本 Claude 的使用策略，将原有的配额更新周期从 5 小时大幅延长至 2 天。这一变化被解读为 Claude 因使用量激增而导致的资源收紧。与此同时，用户社区反馈显示，尽管推出了新版模型，但 Gemini 3 因推理过程冗长、实际编码效率低而未能获得广泛青睐，开发者们依然更青睐使用 Sonnet 4.5 进行代码编写。

原文链接：Linux.do

42分钟前
DeepSeek悄然解锁多模态能力，实测已支持图像识别

DeepSeek在近期更新中悄然上线了多模态能力。经用户测试，DeepSeek App及网站现已能够识别并理解图片内容，如准确辨认物体等。这一更新标志着DeepSeek从纯文本模型向图文结合的多模态AI迈进，补齐了其在视觉感知方面的短板，使其在通用大模型领域的竞争力进一步提升。

原文链接：Linux.do

3小时前
用户吐槽微软 Copilot 智商下降：GPT5.2 竟仅能对标豆包？

一位用户反馈，此前使用“大兵”版本的 GPT5.2 时体验极佳，但切换至微软 Copilot 后，感觉模型智商明显下降，回答问题难以切中要害。对比发现，官网版本尚能与 Gemini 3 Pro 抗衡，而 Copilot 版本的表现却仿佛降级至豆包水平。该贴引发了关于不同平台间同一模型性能差异及是否存在“降智”处理的讨论。

原文链接：Linux.do

3小时前
TikTok新政：收集精准定位与AI交互数据，广告网全面扩张

随着TikTok正式转为美资多数控股，其新隐私政策开始生效。用户需同意新条款才能继续使用，其中包含三项重大变更。首先是开启精准位置追踪，收集GPS数据；其次新增对AI交互的监控，包括用户输入的提示词和AI生成内容；最后扩大广告网络，利用合作出版商的数据在全网投放精准广告。这意味着TikTok在合规的同时，大幅提升了对用户数据的挖掘深度。

原文链接：Hacker News

4小时前
借鉴Rust与C#：现代C语言编程的高质量实践指南

作者分享了在现代开发中使用C语言的个人习惯与最佳实践。尽管日常多用C#和Python，作者仍青睐C语言用于原型开发。文章详述了采用C23标准、定义简化的固定长度类型、避免使用空终止字符串等基础技巧。核心在于借鉴Rust的“解析而非验证”理念，利用不透明类型和结构体在C中实现类型安全与API健壮性。此外，还介绍了模拟元组和结果类型的错误处理机制。这些实践为编写更安全、现代化的C代码提供了极具价值的参考。

原文链接：Hacker News

4小时前
防止数据丢失！Google AI Studio 聊天记录一键导出脚本更新

针对Google AI Studio缺乏官方导出功能及潜在的聊天记录丢失风险，社区开发者推出了修改版油猴脚本。该脚本支持自动滚动捕获完整聊天内容，包括AI思维链、用户消息及模型回答，并能一键导出为TXT文本。此外，脚本还优化了UI交互，新增按钮隐藏和失败提醒功能，有效填补了平台原生功能的短板。

原文链接：Linux.do

4小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始