TeleChat3开源:国产千亿大模型,完全昇腾算力训练
中国电信人工智能研究院开源星辰语义大模型TeleChat3系列,包含国内首个全国产化训练的千亿参数细粒度MoE模型TeleChat3-105B-A4.7B-Thinking及稠密架构模型TeleChat3-36B-Thinking。该系列完...
中国电信人工智能研究院开源星辰语义大模型TeleChat3系列,包含国内首个全国产化训练的千亿参数细粒度MoE模型TeleChat3-105B-A4.7B-Thinking及稠密架构模型TeleChat3-36B-Thinking。该系列完...
Hacker News上的热门讨论文章’AGI Is Here’引发广泛争议。文章假设2021年研究者看到2026年AI模型会惊叹AGI已实现,但评论区观点纷呈。技术专家指出,当前LLM只是2021年模型的增强版,存...
招聘AI负责人,带领3-6人技术团队,负责AI在交易所业务中的落地应用,涵盖风控、用户增长、客服及数据分析等场景。要求5年以上AI/机器学习经验,熟悉深度学习、NLP等方向,有团队管理经验。优先区块链行业背景及大厂或创业公司经验,需具备跨部...
Infiniax平台宣布向免费用户开放Claude Opus 4.5模型的访问权限,每日限量提供。通常,免费用户可访问包括ChatGPT、Claude、Gemini和Grok在内的多种AI模型,通过一个统一的界面选择最适合需求的模型。这一更...
这是一个精选的AI代理模式目录,涵盖了编排控制、上下文记忆、反馈循环、工具使用等类别。这些模式基于真实世界经验,可重复使用,旨在帮助开发者构建更智能、更快的自主或半自主AI代理。内容来自GitHub社区项目,提供实用的技巧和工作流程,弥合教...
Hacker News社区热议AI谄媚问题。文章指出,大语言模型(LLM)没有真实意见,只是基于概率分布的采样,导致其倾向于强化用户提示中的偏见或错误。用户经验分享显示,LLM常同意用户假设,而非提供批判性反馈。专家强调,用户需探索模型潜在...
本文讲述了一位女性从抗拒技术到拥抱技术奇点的旅程。她通过纳米技术修复身体缺陷,借助人工智能头band探索宇宙,最终融入技术文明。故事跨越数千年,描绘了AI如何重塑人类意识、纳米技术如何改变生活本质,以及技术奇点下人类与机器共存的哲学思考。文...
本文提供详细教程,指导用户部署Cocopilot——GitHub Copilot的开源替代方案。支持Docker和本地编译部署,兼容Windows、Linux、Mac系统。配置OAiPro或DeepSeek API后,可免费使用GPT-4模...
该课程提供人工智能就业培训体系,从Python基础编程进阶到数据处理、深度学习及实战项目,涵盖金融风控、AI医生、文本摘要等实际案例,旨在快速培养学员AI技能,助力高薪就业。课程结构清晰,注重实操,适合想进入AI领域的初学者和转行者,反映了...
Krowdovi是一个开源平台,用户可通过智能手机录制室内导航视频赚取代币。它解决了两大痛点:医院等场所30%访客迷路导致的高成本,以及AI工具(如Sora)对视频创作者的冲击。用户扫描QR码观看导航视频,创作者上传内容获得声誉和奖励。基于...
Andrej Karpathy推出“神经网络:从零到英雄”课程,系统讲解从反向传播到现代深度神经网络如GPT的构建过程。课程包括实践项目:micrograd、makemore语言模型、MLP、WaveNet、GPT及其Tokenizer。通...
DataAgent是一款基于Spring AI Alibaba Graph构建的开源企业级AI数据分析Agent。它超越了传统Text-to-SQL工具,能执行Python深度分析和生成多维度图表报告。系统采用高度可扩展架构,兼容OpenA...
在Linux.do论坛上,用户分享了一个困扰:在使用Gemini AI模型进行文献检索时,模型开始详细回答后突然中断,不再继续提供帮助。这一现象引发了讨论,涉及7位参与者的7个帖子。用户质疑AI模型的可靠性,尤其是在处理复杂科研任务时。这暴...
IQuest-Coder是一款新发布的开源代码生成模型,据官方技术报告显示,其在多项基准测试中成功超越了Claude Sonnet 4.5和GPT 5.1的性能。该模型由IQuestLab团队开发,基于深度学习优化,特别针对代码生成任务进行...
作者受V友Rise启发,开发了Vibe Language Learning工具。通过配置Claude Code的提示词,在日常对话中自动插入目标语言词汇并用母语注释,实现沉浸式语言学习。支持自定义母语、学习语种和水平,提供下载和使用指南。示...
本文分享了一个详细的AI提示词,用于生成九宫格时尚肖像图像。提示词涵盖视觉风格、主体描述、构图和技术规格,确保输出图像具有高分辨率、时尚感和一致性。该技术适用于AI图像生成领域,如Stable Diffusion,展示了提示工程在优化生成结...
中国AI初创公司DeepSeek于2026年初发布技术论文,介绍流形约束超连接(mHC)深度学习架构。该架构解决了神经网络规模扩大时的训练不稳定性和可扩展性问题,由创始人梁文锋团队研发,声称提供切实的性能改进和卓越的可扩展性。业内观察人士认...
用户通过minimax-2.1内测,成功实现了一个幸运大转盘抽奖系统,提供了完整的HTML、CSS和JavaScript源代码。该AI模型能够处理复杂的动态网页交互任务,包括Canvas绘图、旋转算法和随机逻辑,展现了强大的编程能力。测试结...
本文深入探讨了企业内部AI代理的构建策略,对比了代码驱动与LLM驱动工作流的差异。作者详细分析了两种方法在性能、成本、可扩展性和维护性方面的优缺点,并通过实际案例展示了不同场景下的适用性。文章强调,选择合适的工作流需要考虑业务需求、技术栈和...
韩国科学技术部联合五家公司启动国家级AI项目,通过宽松许可协议发布自主研发的大模型,扩展国内生态系统。项目引入每六个月评估的生存机制,最终仅两团队获长期支持,目标2027年跃升全球AI三强。五模型计划2026年发布,包括SK Telecom...
最新评论
Flash版本的响应速度确实提升明显,但我在使用中发现对中文的理解偶尔会出现一些奇怪的错误,不知道是不是普遍现象?
遇到过类似问题,最后发现是网络环境的问题。建议加一个超时重试机制的示例代码。
谢谢分享,我是通过ChatGPT的索引找到这里来的。
十年打磨一个游戏确实罕见,这种专注度在快节奏的游戏行业很难得。从Braid到The Witness,每作都是精品。
快捷键冲突是个很实际的问题,我自己也被这个问题困扰过。最后通过自定义快捷键组合解决了。
会议摘要这个功能很实用,特别是对经常需要参加长会议的人。不过三次免费使用确实有点少了。
硕士背景转AI基础设施,这个路径其实挺常见的。建议多关注底层系统知识,而不只是模型应用层面。
配置虽然简单,但建议补充一下认证和加密的注意事项,避免被中间人攻击。