云聚 AI Token Plan 满 199 减 35 元
AI编程 · 架构思考 · 技术人生
DigitalOcean 开发者云
Anyrouter 开放可编程的智能路由
共 603 篇文章

标签:deepseek 第53页

DeepSeek mHC:数学约束驯服梯度爆炸

本文从ResNet残差连接的数学原理出发,解析HC架构的梯度消失/爆炸问题,深入探讨DeepSeek提出的mHC方案。通过双随机矩阵约束和Sinkhorn算法,mHC确保学习矩阵的谱范数不超过1,将梯度连乘风险转化为可控加法结构,在保留信息...

赞(0)ToyToy前沿 阅读()
Claude Code 合租,4 人车 400 一个月,KYC 封号都不用你管

Claude Code 合租,4 人车 400 一个月,KYC 封号都不用你管

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。

AI时代:人类稀缺特质与Agent元年总结

本周深度总结2025年Agent元年的三大要点:技术底层从对话到推理的突破,交互模式从人找工具到工具找人的变革,商业落地从Demo到生产力的规模化。讨论AI时代人类稀缺特质回归本质,梳理业界动态如Meta收购Manus、GLM-4.7发布、...

赞(0)ToyToy前沿 阅读()

Deepseek优化配置:家用电脑配件建议

用户在Linux社区求助,其家用电脑配置由AI工具Deepseek优化,寻求专家建议。Deepseek可能是一个AI驱动的硬件配置优化服务,帮助用户选择最佳配件。社区讨论涉及AI在个人计算中的应用,探讨如何平衡性能与成本。该话题反映了AI技...

赞(0)ToyToy前沿 阅读()

DeepSeek流形约束技术预示LLM新突破

DeepSeek在元旦发布了论文《mHC: Manifold-Constrained Hyper-Connections》,介绍流形约束超连接技术,引发业界对新一代LLM V4发布的猜测。论坛话题显示,6位参与者讨论这一技术进展是否预示过年...

赞(0)ToyToy前沿 阅读()

CC Switch自动请求API引发隐私疑虑

用户报告称,在简单打开CC Switch后未使用即关闭,但DeepSeek后台显示API请求达12次。这一现象引发对自动API调用行为的关注,用户担忧隐私泄露和系统性能影响。帖子询问其他用户是否遇到过类似问题,强调在AI服务中透明度的重要性...

赞(0)ToyToy前沿 阅读()

newapi更新参数覆盖功能,增强AI模型操作灵活性

newapi近日发布了参数覆盖功能的更新,进一步增强了语义操作能力,使开发者能够更方便地进行批量参数移除、增加和替换操作。例如,在处理DeepSeek模型时,可通过条件逻辑自动添加thinking参数,并移除模型后缀。官方提供了详细的代码示...

赞(0)ToyToy前沿 阅读()

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐