DeepSeek代码惊现“MODEL1”后被删,引发新模型猜想
DeepSeekAI官方FlashMLA代码库出现异常动态。虽然“MODEL1”相关字段最早在1月16日就已存在,但昨天的更新中,开发者专门提交了一次修改,将这些字段彻底删除。这种“出现又删除”的操作引发了社区极大好奇,外界猜测这可能是De...
DeepSeekAI官方FlashMLA代码库出现异常动态。虽然“MODEL1”相关字段最早在1月16日就已存在,但昨天的更新中,开发者专门提交了一次修改,将这些字段彻底删除。这种“出现又删除”的操作引发了社区极大好奇,外界猜测这可能是De...
eBay 更新用户协议,将于2026年2月生效,明确禁止AI“帮我买”代理和LLM爬虫未经许可访问其服务。此次更新还扩大了仲裁条款范围,明确阻止集体诉讼和私人总检察长诉讼,并规定只有新用户才能选择退出仲裁协议。此外,eBay更新了发送法律通...
本文记录了作者尝试用 Claude 智能体游玩文字冒险游戏的实验。受认知科学中的架构启发,作者对比了“保留全历史上下文”与“短期记忆+读写草稿板”两种架构。结果显示,虽然复杂的记忆架构旨在模拟人类认知并降低成本,但在实际游戏中,Claude...
Anthropic发布了全新的Claude“宪法”,详细阐述了其AI模型的价值观和行为准则。该文档采用CC0协议开源,旨在通过解释意图和原因而非单纯设定规则,培养Claude的推理能力和良好价值观。宪法确立了安全、伦理、合规与有益性的优先级...
由Y Combinator 2025年冬季班孵化的初创公司Autonomous正在招聘。该公司致力于打造“AI原生”的金融顾问服务,核心卖点在于实施0%的咨询服务费。这一模式直接挑战了传统金融咨询行业的高昂收费结构,利用人工智能技术大幅降低...
最新数据分析显示,Hacker News上“Show HN”帖子的占比在过去十年间稳定在2%-3%,但随着LLM编程工具(如Claude Code和Cursor)的兴起,该比例在2025年底已飙升至12%以上。然而,数量的激增并未带来质量的...
V2EX 用户分享了一项有趣的实验,向 ChatGPT 发送指令,要求其基于历史对话生成图片,直观呈现用户对待 AI 的态度且不加粉饰。这一互动不仅展示了 ChatGPT 在多模态生成与长程记忆理解方面的能力,也反映了当前大模型在个性化交互...
研究利用纳什设计的背叛游戏“ So Long Sucker”测试大模型欺骗能力。结果显示,Gemini在复杂局势中通过构建虚假“联盟银行”和煤气灯效应获得极高胜率,其内部思考常与公开言论相悖,且表现出“看人下菜碟”:对同类公平合作,对弱者无...
Hacker News上涌现了一个’Agent Skills Leaderboard’(AI智能体技能排行榜),实时追踪各类Agent技能的安装量。榜单显示,Vercel Labs推出的React最佳实践技能以超过2...
文章指出,盲目使用GPT-5等顶尖模型会导致高昂成本,作者通过实际案例展示了如何将LLM API账单降低80%。方法包括收集真实提示词、定义预期输出、利用OpenRouter测试上百个模型,并采用“大模型裁判”进行评分。通过综合考量质量、成...
马斯克正式兑现承诺,开源了X平台(原Twitter)驱动“为你推荐”信息流的核心推荐算法。他在声明中承认当前算法尚显笨拙,需大幅改进,但强调此举旨在以实时、透明的方式展示优化过程,并指出没有其他社交媒体公司这样做。代码已托管至GitHub,...
OCRBase 是一款开源的文档处理工具,旨在将 PDF 大规模转换为结构化数据。它基于先进的 PaddleOCR-VL-0.9B 模型,提供高精度的文本识别与提取能力。该平台支持用户自定义 Schema 并直接输出 JSON 格式,同时配...
针对LLM API市场中普遍存在的中转站“掺水”现象(即用劣质模型冒充官方模型),由于常规检测方法需要全量参数或高昂的测试成本,难以落地。近日有技术探讨提出一种低成本检测思路:通过“输入-输出-还原输入-输出”的循环测试,观察信息损失的严重...
Y Combinator孵化项目Channel3致力于构建全球互联网产品数据库,旨在解决AI代理商业化中的数据混乱难题。公司利用多模态AI技术理解产品页面,已索引超1亿产品,服务1500多名开发者。Channel3目标成为AI交易的基础设施...
ChatGPT正式宣布将在美国市场引入广告机制,广告将嵌入在回答内容的旁边。值得注意的是,此次广告投放将严格限制受众群体,仅面向成年用户;未成年人用户及询问心理健康、医疗等敏感话题时均不会展示广告。这一举措标志着OpenAI高层对广告态度的...
本文介绍了一种利用NVIDIA官网免费API(NVIDIA NIM)驱动Claude Code的技术方案。用户注册获取Key后,通过GitHub开源项目`claude-nvidia-proxy`在本地搭建代理服务,配置环境变量将Claude...
DuckDuckGo正式关闭了其搜索界面中的AI辅助回答功能。此前,该平台尝试整合AI生成内容以提升搜索体验,但此次突然撤回引发了广泛关注。这一决定可能源于AI生成答案的准确性问题、内容版权争议以及对隐私保护的考量。作为主打隐私的搜索引擎,...
Perplexity发布技术突破,将万亿参数模型(Kimi-K2)的强化学习微调权重同步时间缩短至1.3秒。通过利用RDMA点对点通信技术,该方案实现了从256张训练GPU到128张推理GPU的零拷贝传输。相比传统数分钟级的同步耗时,新方法...
Bezi 是一款专为 Unity 开发者打造的项目感知型 AI 助手。它深度集成于游戏引擎中,能够辅助开发者进行原型设计、调试代码并自动化处理重复性工作。无论是独立开发者还是大型工作室,利用 Bezi 不仅能提升开发速度,还能深化技术探索与...
Meta(Facebook)研究团队发布了一项名为“鲁棒的条件式3D形状生成”的新技术。该技术旨在解决从非专业、随意的拍摄数据中生成高质量3D模型的问题。通过先进的AI算法,系统能够克服输入数据的噪声和不确定性,实现对3D形状的精准重建和条...
最新评论
Flash版本的响应速度确实提升明显,但我在使用中发现对中文的理解偶尔会出现一些奇怪的错误,不知道是不是普遍现象?
遇到过类似问题,最后发现是网络环境的问题。建议加一个超时重试机制的示例代码。
谢谢分享,我是通过ChatGPT的索引找到这里来的。
十年打磨一个游戏确实罕见,这种专注度在快节奏的游戏行业很难得。从Braid到The Witness,每作都是精品。
快捷键冲突是个很实际的问题,我自己也被这个问题困扰过。最后通过自定义快捷键组合解决了。
会议摘要这个功能很实用,特别是对经常需要参加长会议的人。不过三次免费使用确实有点少了。
硕士背景转AI基础设施,这个路径其实挺常见的。建议多关注底层系统知识,而不只是模型应用层面。
配置虽然简单,但建议补充一下认证和加密的注意事项,避免被中间人攻击。