传OpenAI接入Cerebras芯片,GPT-5.2推理速度暴涨
近日,有开发者在OpenAI Codex中发现模型ID显示为“gpt-5.2-xhigh”,其推理速度出现暴涨,思考过程呈现“刷屏”般的生成效果。用户推测这与近期OpenAI与AI芯片巨头Cerebras签署的100亿美元合作协议有关。该协...
近日,有开发者在OpenAI Codex中发现模型ID显示为“gpt-5.2-xhigh”,其推理速度出现暴涨,思考过程呈现“刷屏”般的生成效果。用户推测这与近期OpenAI与AI芯片巨头Cerebras签署的100亿美元合作协议有关。该协...
OpenAI 宣布与 AI 芯片厂商 Cerebras 签署价值 100 亿美元的算力协议,计划购入 750 兆瓦推理算力。Cerebras 凭借其独特的巨型芯片架构,有效解决了传统硬件瓶颈,能显著提升 AI 模型的响应速度。此次合作旨在将...
美国众议院通过《远程访问安全法案》,旨在封堵算力出口管制漏洞。法案将“远程访问”纳入出口管制体系,禁止外国实体在未获许可情况下,通过云服务远程使用美国本土的高端AI芯片和算力。无论设备位于何处,只要涉及向敏感国家或受限实体提供受管制算力接口...
本文详细记录了作者以有限预算完成ASIC流片的全过程,涵盖设计挑战、成本优化、制造流程及经验总结。针对AI芯片开发需求,文章分享了如何利用开源工具和精简策略降低流片门槛,为关注硬件创新的读者提供实用参考。内容涉及芯片设计细节、预算控制技巧,...
AMD于2025年8月发布了使用MI300X芯片部署GPT-OSS-120B模型的方案,并构建了一个演示聊天机器人。该模型响应速度快,支持自定义提示、温度设置等参数,适合沉浸式翻译等应用场景。然而,该技术似乎在行业内讨论热度不高,引发关注。...
雅虎财经报道,CNBC证实,英伟达公司已宣布以200亿美元全现金收购高性能人工智能加速芯片设计公司Groq。这笔交易是英伟达历史上规模最大的收购案,标志着其在AI芯片领域的重要扩张。Groq以其创新的加速器技术闻名,此次收购将进一步强化英伟...
英伟达近日否认了中国AI初创公司DeepSeek使用禁售的Blackwell芯片训练最新模型的指控。此前,外媒《The Information》报道称,DeepSeek使用的Blackwell芯片通过复杂走私手段被运往中国,装有Blackw...
AWS正式发布Trainium3芯片,并公布Trainium4路线图。该芯片基于TSMC N3P工艺,内存带宽提升70%,支持创新的交换网络架构以优化MoE模型性能。AWS通过开源PyTorch后端和编译器等软件策略构建开发者生态,同时强调...
本文深入探讨了昇腾910b AI芯片的算力租赁平台选择。用户提问是否有支持按小时租赁的平台,并分享了autodl平台的体验:虽然可以租赁,但测试好的镜像无法下载,影响使用便利性。同时,启智ai平台被推荐为免费选项,提供包括昇腾在内的多种国产...
文章深入剖析了Google TPU芯片架构的发展历程,特别指出Ironwood已是第七代TPU,技术迭代持续演进。讨论聚焦中国在TPU领域的潜在突破,包括中国初创企业已开始生产TPU集群并产生收入。同时揭示TPUv4/v6技术文档被窃事件引...
英伟达发布最新AI芯片GB200 NVL72,宣称可将开源AI模型性能最高提升10倍,直接挑战谷歌TPU和亚马逊Trainium等竞争对手。这一产品发布正值AI芯片市场竞争白热化阶段,英伟达通过性能数据证明其技术领先地位。GB200 NVL...
最新评论
Flash版本的响应速度确实提升明显,但我在使用中发现对中文的理解偶尔会出现一些奇怪的错误,不知道是不是普遍现象?
遇到过类似问题,最后发现是网络环境的问题。建议加一个超时重试机制的示例代码。
谢谢分享,我是通过ChatGPT的索引找到这里来的。
十年打磨一个游戏确实罕见,这种专注度在快节奏的游戏行业很难得。从Braid到The Witness,每作都是精品。
快捷键冲突是个很实际的问题,我自己也被这个问题困扰过。最后通过自定义快捷键组合解决了。
会议摘要这个功能很实用,特别是对经常需要参加长会议的人。不过三次免费使用确实有点少了。
硕士背景转AI基础设施,这个路径其实挺常见的。建议多关注底层系统知识,而不只是模型应用层面。
配置虽然简单,但建议补充一下认证和加密的注意事项,避免被中间人攻击。