 

共 3 篇文章

标签：CPU推理

纯C语言实现Gemma 3推理，大模型无需GPU也能跑

开发者发布了名为 `gemma3.c` 的项目，成功用纯 C 语言实现了 Google Gemma 3 4B IT 模型的推理引擎。该项目完全不依赖 Python、PyTorch 或 GPU，展示了现代大模型在低资源环境下的运行能力。该引擎...

Toy2026-01-29前沿阅读(1)去评论

MiniCPM-V2.6 CPU推理耗时数分钟，优化引关注

近日，有用户发现在使用MiniCPM-V2.6模型时，CPU推理一张图片需要大量时间，据称可能达到255秒甚至360秒，而模型加载仅需5秒左右。这一现象引发了对CPU推理性能优化的讨论。在AI应用日益普及的背景下，如何在普通硬件上提高模型推...

Toy2025-12-23前沿阅读(38)去评论

轻量级NSFW图像识别方案开源：支持CPU推理与HTTP API

本文介绍了一款开源的NSFW（不适合工作场所）图像识别方案，专为需要检测色情图像的应用场景设计。该方案基于AdamCodd/vit-base-nsfw-detector实现，采用纯CPU推理方式，适合大多数云服务器或VPS部署。项目支持jp...

Toy2025-12-05前沿阅读(85)去评论

前沿哨所

特斯拉2025年利润暴跌46%，业绩遭遇寒冬

特斯拉发布的最新财报显示，公司2025年利润同比大幅下滑46%。这一惊人降幅反映了电动汽车市场面临的价格战压力及需求疲软。尽管公司在AI与自动驾驶领域持续投入，但短期内难以抵消核心业务利润率的缩水，市场对其未来增长策略和盈利能力表示担忧。

原文链接：Hacker News

5分钟前
微软开源Bf-Tree：优化超大数据读写并发性能

微软在GitHub开源了Bf-Tree，这是一种针对现代读写密集型应用设计的并发范围索引。该技术专门优化了超过内存容量的数据集处理能力，通过改进并发控制机制，显著提升了大规模数据场景下的读写效率，为高性能数据库系统的底层架构提供了新的解决方案。

原文链接：Hacker News

5分钟前
美团发布LongCat-Flash-Lite模型，68.5B参数编程性能领跑同类

美团正式推出68.5B参数混合专家模型LongCat-Flash-Lite。该模型采用独特的N-gram嵌入技术，激活参数仅约3B，支持256k上下文长度。在智能体工具调用和编程基准测试中，该模型表现统治级，SWE-Bench准确率达54.4%，大幅领先Gemini和Qwen等竞品。这一发布标志着美团在AI智能体和代码生成领域取得了重大技术突破。

原文链接：Linux.do

5分钟前
Kilo Code实测：利用Kimi k2.5一行提示词生成完整网站

社区实测显示，利用Kilo Code平台接入Kimi k2.5模型，仅通过一行包含具体需求的提示词，即可成功生成一套包含领养、赞助功能及SVG图标的流浪猫公益网站。这一案例生动展示了当前AI代码生成工具在复杂任务中的高效性，标志着自然语言编程在实际应用中的门槛进一步降低。

原文链接：Linux.do

5分钟前
苹果强制Patreon切换支付系统，将对iOS端创作者抽成30%

苹果已设定最后期限，要求所有Patreon创作者在2026年11月1日前，于iOS版应用中强制切换至App Store的内购支付系统。苹果视此类支付为数字商品交易，将从中抽取最高30%的佣金，长期订阅费率降至15%。创作者可选择仅提高iOS端价格或自行承担费用，用户仍可通过网页端支付以规避佣金。目前仅4%的创作者尚未切换，Patreon对此政策表示失望。

原文链接：Hacker News

1小时前
Kairos：能自主操作软件的AI智能体，打造你的全能数字实习生

Kairos是一款全新的AI工具，定位为“AI实习生”。与传统聊天机器人不同，它拥有专属浏览器，能像真人一样登录账号、填写表单、浏览网页并提取数据。该工具深度集成Gmail、Notion等20多款应用，支持在后台自动执行招聘筛选、退款处理、会议安排等复杂工作流。用户只需通过邮件或指令交互，即可实现营销、销售等领域的全流程自动化。

原文链接：Hacker News

1小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始