微软推出4B参数3D生成模型TRELLIS.2
微软发布TRELLIS.2,一个4B参数的大型3D生成模型,采用创新的O-Voxel稀疏体素结构,支持高质量图像到3D转换。该模型能处理复杂拓扑结构,如开放表面和内部封闭空间,提供丰富的PBR材质建模,包括基础颜色、粗糙度、金属度和不透明度...
微软发布TRELLIS.2,一个4B参数的大型3D生成模型,采用创新的O-Voxel稀疏体素结构,支持高质量图像到3D转换。该模型能处理复杂拓扑结构,如开放表面和内部封闭空间,提供丰富的PBR材质建模,包括基础颜色、粗糙度、金属度和不透明度...
OBS Studio 32.0.0 引入基于 Apple Metal API 的新渲染器作为实验性替代方案。文章深入探讨了 Metal 渲染器的技术实现,包括着色器语言转换、模拟 Direct3D 行为等挑战。新渲染器通过优化 GPU 资源...
本文由资深图形程序员Sebastian Aaltonen撰写,深入探讨了图形API的历史演变与未来方向。作者基于30年行业经验,指出DirectX、Vulkan和Metal等现代API已过时,其设计基于十年前的GPU架构,导致复杂性和性能问...
一位技术爱好者拥有机器学习背景,计划重新开发量化投资模型,但面临训练资源短缺问题。预算在3万元以内,考虑自建训练机或租用云服务,尤其关注按需付费选项。文章寻求社区经验分享,讨论硬件配置与云GPU租用的优劣,为AI开发者提供资源选择的实用指南...
cuTile Python是NVIDIA推出的创新编程模型,专为编写NVIDIA GPU的并行内核而设计。它基于Tile IR规范,支持Python语言,为开发者提供了使用熟悉语法定义和优化分块GPU内核的功能。该模型旨在提高NVIDIA ...
文章深入剖析了树莓派与众不同的启动机制:与传统PC不同,树莓派启动时GPU(VideoCore)先被激活并执行固件,负责初始化系统、分配内存和加载ARM内核。只有在GPU完成所有准备工作后,ARM CPU才被唤醒并运行Linux。这一设计源...
奇绩创坛校友创建了一个非官方项目数据库,汇总2021-2025年路演项目,提供搜索、统计和可视化功能。该工具帮助用户快速了解奇绩的投资趋势,特别是AI、具身智能和出海赛道。作者利用AI在一天内开发完成,展示了AI的强大。数据库支持按方向搜索...
中国AI初创公司DeepSeek被《The Information》报道使用被美国禁止的Nvidia Blackwell芯片开发即将推出的AI模型。这些芯片通过允许销售的国家走私到中国,DeepSeek在未指定国家数据中心安装后拆卸运往。美...
本文详细描述了在Cloud Studio平台利用免费时长部署AutoGLM模型的实践过程。该模型基于PyTorch深度学习框架,集成GPU加速,提供可视化运行界面,适合开发者快速验证AI推理流程。通过在《星穹铁道》游戏中的测试,AutoGL...
本文深入解析了豆包手机的AI工作流程,通过分析核心进程、关键权限,并结合日志和部分反编译代码,详细还原了AI的读屏机制和自动操作的业务逻辑。研究表明,豆包手机实现了高完成度和强泛化能力的GUI Agent,代表了AI在移动设备上的重要突破。...
AWS正式发布Trainium3芯片,并公布Trainium4路线图。该芯片基于TSMC N3P工艺,内存带宽提升70%,支持创新的交换网络架构以优化MoE模型性能。AWS通过开源PyTorch后端和编译器等软件策略构建开发者生态,同时强调...
本文以’野火’比喻分析当前AI行业的发展周期,认为这并非简单泡沫,而是必要的调整与重生。作者将公司分为四类:易燃灌木丛(缺乏真正价值者)、防火巨头(如苹果、微软等)、重新生长者(失败后调整者)和野花(调整后出现的新星...
本文介绍了一个名为 koharu 的开源工具,使用 Rust 编写,专为跨平台漫画汉化设计。工具支持日语翻译到中文和英文,结合本地运行的 8B 大语言模型(LLM)进行翻译,并利用多个计算机视觉模型处理文字检测、识别和图像修复。技术亮点包括...
Aurora是一个革命性的Linux发行版,专为工作站和AI工作负载打造。基于高度可定制的KDE Plasma桌面环境,提供隐私尊重、流畅且稳定的用户体验。其创新的镜像更新系统在后台自动应用更新,支持回滚到已知良好状态,确保系统可靠性。Au...
知名性能分析专家Brendan Gregg宣布离开英特尔,结束了其在该公司3.5年的任职。在英特尔期间,Gregg开发了开源的AI火焰图,创建了GPU亚秒级偏移热图,并在eBPF技术委员会担任领导角色,展现了其在性能分析领域的深厚造诣。他特...
摩尔线程今日成功上市,创始人张建中在发布会上宣布推出迭代全功能GPU技术,旨在为人工智能、自动驾驶和芯片设计等领域提供强大计算能力。这一突破性技术不仅提升了硬件性能,还承诺通过创新架构加速全球产业升级,推动前沿科技发展。华尔街见闻的报道详细...
国产GPU行业正面临激烈竞争,随着国际技术封锁加剧,国内企业加速布局图形处理单元领域,争夺市场窗口期。文章深入分析了中国GPU厂商的技术路线、研发进展及挑战,包括芯片设计、制造工艺和生态建设等方面,探讨了在AI、自动驾驶等前沿领域的应用潜力...
CUDA-L2是一个创新系统,结合大语言模型(LLM)和强化学习(RL)自动优化半精度矩阵乘法(HGEMM)CUDA内核。在A100 GPU上测试的1000个配置中,它显著超越了torch.matmul以及NVIDIA的专有库cuBLAS、...
全球内存短缺危机持续加剧,价格飙升数倍,根源在于AI数据中心建设需求激增。PC构建者首当其冲,DDR4内存从$30涨至$120,DDR5从$150涨至$500。小型科技公司如Libre Computer面临内存成本翻倍,Raspberry ...
Tracy Profiler 是一个实时、纳秒分辨率的性能分析器,专为游戏和应用程序优化设计。它支持全面的 CPU 分析(包括 C、C++、Python、Rust 等语言绑定)和 GPU 分析(覆盖 OpenGL、Vulkan、Direct...