 

当前位置：80aj  前沿  正文

TeleChat3开源：国产千亿大模型，完全昇腾算力训练

2026-01-05 分类：前沿阅读(233) 赞(0)

中国电信人工智能研究院开源星辰语义大模型TeleChat3系列，包含国内首个全国产化训练的千亿参数细粒度MoE模型TeleChat3-105B-A4.7B-Thinking及稠密架构模型TeleChat3-36B-Thinking。该系列完全基于上海临港国产万卡算力池训练，基础数据量达15T tokens，全系支持Thinking思考模式，在知识、数学、创作、代码、Agent及指令遵循等六维度比肩业内头部模型。已深度适配昇腾Atlas 800T A2训练服务器及昇思MindSpore框架，资源已在GitHub和ModelScope上线，推动国产AI生态发展。

原文链接：Linux.do

赞(0)

未经允许不得转载：80aj » TeleChat3开源：国产千亿大模型，完全昇腾算力训练

分享到

agent AI GitHub 人工智能大模型昇腾

前沿哨所

ThreeBox 开源：像聊天一样生成 3D 模型，支持游戏场景与物理引擎
ThreeBox 是一款基于 ThreeJSON 内核构建的开源 3D 生成应用，允许用户通过自然语言聊天界面创建可交互、可编辑且可导出的 3D 模型与完整场景。与传统生成静态图像的 AI 工具不同，ThreeBox 强调动态交互性，支持自动纹理贴图、文字标注、特效、粒子系统以及物理引擎集成。该工具在用户提示词与 AI 接口之间建立了基于 ThreeJSON 的描述性中间层，有效降低了模型生成过程中的 Token 消耗，并允许用户配置任意大模型供应商的 API。作为 MIT 协议下的开源项目，ThreeBox 目前对所有用户免费开放，支持 PC 与移动端适配。用户可将生成的内容导出为适用于 3D 打印或游戏开发的主流格式，广泛应用于游戏地图构建、数字孪生搭建、机器人仿真训练及展览展示等专业场景。

事件分析

ThreeBox 的核心价值在于通过引入 ThreeJSON 中间层协议，解决了大语言模型直接生成复杂 3D 数据时面临的 Token 消耗过高与语义失真问题。这种“指令式”而非“生成式”的路径，使得利用通用 LLM 控制复杂 3D 场景变得更加经济且精准，为 3D 内容的“CLI 命令行”提供了可能。从产业角度看，该项目开源意味着开发者可以在不依赖封闭生态（如 Roblox 或 Unity Asset Store）的情况下，利用 AI 快速构建虚拟环境，加速了游戏原型开发与数字孪生项目的迭代周期。其支持物理引擎和可导出特性的结合，填补了文本转 3D 工具在工程落地层面的空白，预示着 AI 辅助 3D 生产正从概念玩具向实用生产力工具转变。

💡 核心观点：ThreeBox 通过中间层技术大幅降低了 3D 生成的 Token 成本，预示着 AI 从生成静态图像迈向构建可交互物理世界的“Stable Diffusion”时刻。

原文链接：V2EX 分享发现
刚刚
望月新一ABC证明遭重击：加藤团队利用Lean验证确认关键论证无法形式化
在2026年7月17日的新闻发布会上，加藤文元团队展示了他们过去两年的研究成果，指出望月新一在关于ABC猜想的IUT（宇宙际Teichmüller理论）论文中，从定理3.11到推论3.12的论证方式是“无法形式化”的。这意味着该部分逻辑无法被计算机验证系统（如Lean）严格定义和证明，从而构成了潜在的逻辑漏洞。虽然加藤团队提到，由于望月新一近期对该点的解释开始出现变化，因此他们暂保留最终判决，但目前的结论对IUT理论的有效性提出了严峻挑战。作为LANA项目的核心成果，该团队不仅利用计算机辅助验证了这一复杂数学理论，还为大众提供了一份可读性强的关键论证分析文档，并将其与2018年Scholze-Stix的批评报告进行了对比。这一事件被视为计算机形式化验证在解决顶级数学争议中发挥关键作用的里程碑。

事件分析

本次事件的核心在于计算机形式化验证工具对顶级数学难题的介入与裁决。望月新一的IUT理论曾因过于晦涩深奥而难以在人类数学界达成共识，Scholze与Stix曾于2018年指出其证明存在无法弥补的缺陷，而此次加藤文元团队利用Lean语言进行的独立验证，从计算机逻辑的角度确认了关键论证环节的“不可形式化”特性，即该逻辑无法被转化为严谨的代码规则。这不仅是单纯的技术纠错，更展示了AI辅助工具在数学真理判定中日益增长的权威性。随着数学理论复杂度的提升，纯粹依靠人类大脑进行逻辑审查的局限性日益凸显，形式化验证正在成为判定数学证明有效性的“终极法庭”。未来，这种“人机协作”或“机机验证”的模式可能会重塑数学出版的审核标准。

💡 核心观点：计算机形式化验证正在成为数学真理的终极裁决者，这一里程碑事件标志着高深数学研究范式正从人类经验共识向机器逻辑验证的彻底转型。

原文链接：Hacker News
刚刚
数字进化新发现：GitHub开源项目复现“数字原生汤”中的自我复制与功能协同进化
题为《数字原生汤中自我复制与功能的协同进化》的研究及其后续的独立代码复现，近期在技术社区引发了广泛关注。该项目源自一篇ArXiv论文，核心议题是在虚拟的“数字原生汤”环境中，探索生命形式的起源与演变机制，特别是“自我复制”能力与“功能效用”这两个关键特性如何在漫长的计算过程中实现协同进化。

研究指出，在计算机科学构建的虚拟“原生汤”中，简单的数字生物体面临严酷的生存竞争。实验揭示了进化论中的一个核心难题：如果数字生物体过分专注于自我复制，会导致系统中充满无意义的“垃圾代码”而耗尽资源；反之，如果只追求执行特定功能而忽视繁衍，种群则会迅速灭绝。该研究发现，只有当两者达到一种微妙的平衡，数字生物体才能既保持种群的延续，又进化出处理复杂信息或执行特定任务的高级能力。

Hacker News 用户 vicgalle 在讨论该论文的同时，迅速在 GitHub 上发布了一个独立的开源项目，成功复现了论文中的主要实验结果。这一行动体现了开源社区对前沿科研成果的快速响应与验证能力。通过实际运行的代码，该项目证实了在数字生态系统中，复杂的结构和功能确实可以从无序状态中自发涌现。这种从零开始的数字进化实验，不仅为理解地球生命的起源提供了数学模型，也为人工智能领域的底层逻辑——特别是关于自动代码生成、程序自我修复以及无监督学习系统的演变——提供了极具价值的研究范式。

事件分析

本次事件标志着人工智能与人工生命研究领域的一个重要交汇点，特别是进化算法在模拟自然智能方面的潜力。从技术维度来看，该研究突破了当前依赖大规模数据预训练的主流AI范式（如大语言模型），转而探索在受限环境中，基于简单规则的竞争与协作如何“涌现”出复杂的智能行为。GitHub上出现的独立复现代码，证明了此类发现具有极高的可复现性，也展示了开源社区在加速科学验证中的关键作用。

从产业影响来看，这种“协同进化”机制为构建更具适应性和鲁棒性的AI系统提供了全新思路。它暗示未来的软件开发可能不再完全依赖人类逐行编写，而是通过定义环境约束，让智能体在数字空间中通过优胜劣汰自动“生长”出最优解决方案。这可能推动AI智能体从单纯的“工具”向具备自主进化能力的“数字物种”转变，对未来AI安全与自动化开发工具的演进具有深远启示。

💡 核心观点：该实验证明了智能并非只能通过海量数据训练获得，在特定规则下的自然选择与协同进化同样是通往复杂智能与自主生成代码的可能路径。

原文链接：Hacker News
刚刚
开源AI新突破：树莓派RP2350芯片实现500KB内存全流程语音交互
Moonshine Voice 团队发布了专为嵌入式系统设计的 Moonshine Micro 开源工具包，实现了在低成本微控制器上运行完整语音交互栈的突破。该项目以售价仅0.8美元的树莓派 RP2350 芯片为参考平台，展示了惊人的资源优化能力：仅需约 468 KB 的 SRAM 和 3.6 MB 的 Flash 存储空间，即可在本地运行包括语音活动检测（VAD）、语音转文字（STT）以及神经语音合成（TTS）在内的全套流程。这一成就打破了 AI 应用通常依赖昂贵硬件或云端算力的限制。其采用的 SpellingCNN STT 模型和 TinyVadCNN 模型经过高度压缩，能在极低的算力需求下（约 36-65 MMAC/s）保持实时响应，整个识别与合成回复的延迟控制在 0.7 至 1.0 秒之间。代码采用宽松的 MIT 许可证发布，非常适合商业应用。该工具包不仅包含独立的 VAD、STT、TTS 库，还提供了基于 TensorFlow Lite Micro 的完整端到端示例，为开发者在资源受限的物联网设备上集成智能语音功能提供了全新的解决方案。

事件分析

在技术层面，该项目展示了极致的模型压缩与优化能力。通常情况下，语音识别与合成需要百兆级内存或云端 API 支持，而 Moonshine Micro 通过定制的神经网络架构和高效的内存时复用策略，将内存占用压缩至 500KB 以内，使得复杂的 AI 逻辑得以在单芯片微控制器上运行。这一进展对物联网产业具有深远影响，意味着智能家居传感器、可穿戴设备或工业控制器等低成本硬件，无需联网即可具备人机交互能力，彻底解决了延迟、隐私和带宽成本问题。随着 RISC-V 和 ARM Cortex-M 等架构性能的提升，这种“本地化微 AI”将成为边缘计算的新常态，推动“离线智能”设备的爆发式增长。

💡 核心观点：打破端侧算力瓶颈，将全流程语音AI成本压低至1美元以内，重新定义了边缘智能设备的准入门槛。

原文链接：Hacker News
刚刚
GPT-5.6 上下文窗口被指“阉割”：实为 Codex 前端限制，后端仍支持超大吞吐
近期，关于 GPT-5.6 系列模型上下文窗口大幅缩减的讨论在开发者社区引发热议。根据 GitHub 上 Codex 的更新日志，最新 0.144.6 版本将 GPT-5.6 系列模型的上下文窗口“修正”为 272k，扣除 5% 冗余后，用户可用的上下文长度降至 258k，与 GPT-5.5 模型持平。官方日志中“corrected”一词的使用，暗示此前宣称的 372k 上下文可能属于漏洞。然而，通过技术实测发现，这实际上仅是前端配置的限制。测试显示，尽管前端界面锁定在 258k，但底层 API 接口仍能处理超过 350k token 的输入数据并正常返回结果，并未报错。进一步分析 Codex 源码发现，系统通过 `min(model_context_window, 272000) * 0.95` 的逻辑硬编码了这一上限，意味着单纯修改前端配置文件无法解锁更多上下文，这更多是软件层面的一种资源管控策略。

事件分析

此次上下文窗口的变动，本质上是软件厂商在模型能力释放与算力成本控制之间的一次平衡调整。虽然后端模型实测证明其具备处理超长上下文的潜在能力，但 Codex 通过硬编码方式在前端实施“降级”，这可能是为了规避在高并发超长上下文场景下可能出现的算力过载或延迟抖动风险。对于依赖长文本分析和大规模代码重构的开发者而言，这种非技术瓶颈的人为限制略显遗憾，但也侧面反映了当前大模型商业化落地中，服务稳定性与极致参数之间的权衡正趋于理性。

💡 核心观点：前端限制并非模型能力退化，而是厂商通过软件层面对计算资源与成本进行的主动管控。

原文链接：Linux.do
刚刚
Kimi 新版“K3”发布后短暂宕机，服务已恢复正常
据国内开发者社区 Linux.do 用户反馈，月之暗面旗下的 AI 助手 Kimi 在其最新版本 K3 发布期间出现了一次短暂的服务故障。多位参与者在论坛发帖称无法正常访问 Kimi 的相关服务，怀疑服务器出现崩溃或过载情况。根据社区讨论的时间线，此次服务中断持续了数分钟，随后在当日下午 3 点 17 分左右，系统监测到服务状态恢复“复活”，用户访问逐渐恢复正常。此次故障发生在 Kimi 推出被业内称为“K3”的新模型版本之际，具体原因可能涉及新版本发布后的流量激增或基础设施扩容滞后，目前官方尚未就具体技术故障细节发布正式通告，仅从社区反馈确认服务已恢复。

事件分析

这种“发布即宕机”的现象在大型模型（LLM）落地过程中较为典型，通常暴露了基础设施在高并发场景下的短板。新版本模型（如 K3）往往伴随着推理策略的变更或上下文窗口的扩大，这会对 GPU 集群的显存带宽和负载均衡带来瞬时冲击。当新版本发布引发大量用户同时尝鲜，现有的 KV Cache 缓存机制或推理节点调度可能未能及时应对流量波峰，从而导致服务不可用。这表明，对于头部大模型厂商而言，技术竞争的焦点已不仅仅局限于模型性能的提升，如何保障大规模高并发下的服务稳定性与弹性伸缩能力，已成为产品化的关键门槛。

💡 核心观点：大模型产品化不仅是算法能力的比拼，更是高并发场景下基础设施稳定性与弹性伸缩能力的极限考验。

原文链接：Linux.do
刚刚

GLM Claude Code · 国产平替不封号

官方 Claude Code 又涨价又要 KYC,封号还得重配环境?智谱 GLM 兼容 Claude Code,稳定不封号、价格友好,注册后把现有 Claude Code 工作流直接切过来继续用。

立即体验 GLM查看套餐价格

TeleChat3开源：国产千亿大模型，完全昇腾算力训练

相关推荐

作者介绍

Toy

置顶推荐

前沿哨所

ThreeBox 开源：像聊天一样生成 3D 模型，支持游戏场景与物理引擎

事件分析

望月新一ABC证明遭重击：加藤团队利用Lean验证确认关键论证无法形式化

事件分析

数字进化新发现：GitHub开源项目复现“数字原生汤”中的自我复制与功能协同进化

事件分析

开源AI新突破：树莓派RP2350芯片实现500KB内存全流程语音交互

事件分析

GPT-5.6 上下文窗口被指“阉割”：实为 Codex 前端限制，后端仍支持超大吞吐

事件分析

Kimi 新版“K3”发布后短暂宕机，服务已恢复正常

事件分析

最新文章

热门专题

热门标签

网站统计

GLM Claude Code · 国产平替不封号

官方 Claude Code 又涨价又要 KYC,封号还得重配环境?智谱 GLM 兼容 Claude Code,稳定不封号、价格友好,注册后把现有 Claude Code 工作流直接切过来继续用。