 

共 687 篇文章

标签：人工智能第10页

Gemini 3.0 Pro vs OpenAI 5.2：历史地图查询测试暴露性能差距

近日，一位用户在Linux.do社区分享了针对AI模型的实际测试：查询1964年以前中国地图信息时，Gemini 3.0 Pro提供了错误链接，而OpenAI 5.2 Thinking则准确找到答案。这一比较突显了AI模型在历史信息检索任务...

Toy2025-12-28前沿阅读(37)去评论

开源AI桌面助手PolarisDesk：跨平台多模态Agent新尝试

开源项目PolarisDesk是一款AI驱动的跨平台桌面助手，旨在成为更懂用户电脑状态的智能工具。它支持多模型适配（如Claude）、文档理解、屏幕信息读取等功能，基于Electron架构构建。项目提供多种实用场景，如自动生成命令、分析错误...

Toy2025-12-28前沿阅读(40)去评论

LLM编程：从模糊到确定的范式革命

本文探讨了软件开发中的核心挑战：规范往往过于模糊，导致开发者依赖“感觉编程”（vibe coding），如同一场彩票游戏。作者提出创新方法：从规范开始，逐步添加细节，每次利用LLM的上下文能力重新生成代码，使输出更接近确定性。这种范式转变不...

Toy2025-12-28前沿阅读(34)去评论

AI重现AOL 3.0：Dialtone服务器上线

Hacker News上，用户分享了Dialtone项目，这是一个现代网站，旨在重现AOL 3.0服务器的怀旧体验。项目结合了AI技术（如大语言模型grok），让用户感受早期拨号上网的乐趣，包括AIM聊天、关键词搜索和封闭生态系统。评论中，...

Toy2025-12-28前沿阅读(32)去评论

SKT发布韩国首个超大规模AI模型A.X K1

SK Telecom今日正式推出韩国首个超大规模人工智能模型A.X K1，参数规模高达519B。该模型设计为母模型，计划将内容转移到更小的模型（70B以下），作为其他模型的基础起点。参与该项目的机构包括SK Telecom、Krafton、...

Toy2025-12-28前沿阅读(39)去评论

开源AI图像编辑工具：支持画笔涂抹和局部框选编辑

一款简约的AI图片生成编辑网站已开源于GitHub，用户可通过画笔涂抹或框选图片局部区域进行编辑修改，支持一次性修改多个区域。该项目针对复杂图形编辑，但可能误改原图其他元素，开发者建议通过调整提示词指令来避免。来自Linux.do社区的讨论...

Toy2025-12-28前沿阅读(33)去评论

AI革命：开发者行业面临比旅行社更剧烈的变革

本文通过对比旅行社行业被互联网颠覆的历史（10年萎缩70%）与当前AI对开发者行业的冲击，指出开发者面临的变革将更加快速。数据显示，自GPT-4发布仅2.5年后，LLM采用率已超过美国人口的40%，开发者使用率从2022年的0%飙升至202...

Toy2025-12-28前沿阅读(37)去评论

Gemini-3-Flash API调用失败：部署问题分析

在部署谷歌Gemini模型gemini-balance时，用户报告调用gemini-3-flash-preview API时频繁遇到429错误，表明请求被拒绝。有趣的是，API key验证通过，且在谷歌AI Studio中成功调用了一次模型...

Toy2025-12-28前沿阅读(38)去评论

优化AI交互：我的Gemini系统提示词技巧

作者分享了经过长期调教的Gemini系统提示词，涵盖事实核查、回复风格、引用规范和视频使用规则。具体包括：要求AI双重检查事实，使用多资源确认；回复需简洁，提供TL;DR摘要；引用需清晰标注来源和位置；避免在IT相关讨论中引用YouTube...

Toy2025-12-28前沿阅读(37)去评论

AI IDE推荐：毕设实用工具指南

随着人工智能技术的快速发展，开发者正寻求更高效的工具来提升工作效率。本文作者即将开始毕业设计项目，希望从网页版AI工具（如GPT、Claude、Gemini）升级到专业IDE，以获得更强大的编程支持。他在Linux.do社区发起讨论，寻求社...

Toy2025-12-28前沿阅读(38)去评论

Google Antigravity：一键翻译长篇论文神器

面对300多页论文的翻译挑战，现有工具各有局限：Google Drive的OCR翻译质量欠佳，Gemini虽翻译质量高但需逐段处理，耗时费力。Google Antigravity作为一款人工智能驱动的IDE，提供了创新解决方案。它不仅能翻译...

Toy2025-12-28前沿阅读(43)去评论

AI基础设施入门速成攻略

本文来自Linux.do技术论坛，作者详细描述了获得AI基础设施offer后的学习困境。作者对人工智能底层知识几乎为零，却需在一个月内掌握推理加速或KV cache等关键技术。文章中，作者诚恳询问学习路线，包括从基础到进阶的速成方法，并探讨...

Toy2025-12-27前沿阅读(43)去评论

2026年AI展望：从Agent到操作系统的飞跃

2025年被称为AI Agent元年，Claude code等产品改变了生活，MCP、skill、subagent等技术兴起。2026年有望成为AI操作系统之年，豆包手机等AI操作电脑项目开始出现。文章表达了对明年AI发展的期待，涵盖了从A...

Toy2025-12-27前沿阅读(69)去评论

开源Android应用AutoGLM，无需电脑直接运行AI任务

AutoGLM For Android是一款基于Open-AutoGLM开源项目的二次开发应用，革命性地将复杂的AI任务直接引入Android设备，无需电脑或ADB连接。通过Shizuku授权，用户可在手机上无缝控制各种任务，包括自定义系统...

Toy2025-12-27前沿阅读(40)去评论

剑桥萌叔AI智能课：系统学习人工智能的完整资源

这套’剑桥萌叔AI智能课’是一套全面的AI学习资源，包含31个视频课程，内容涵盖人工智能基础、大模型原理、提示词技巧、AIGC应用等多个方面。课程从AI起源讲起，深入探讨人工智能在各领域的应用，包括教育启蒙、设计流程...

Toy2025-12-27前沿阅读(45)去评论

AI技术复活无验证码手机号，注册新谷歌号研究

本文探讨了谷歌账户注册中手机号码验证次数用完的棘手问题。作者通过观察号商实现无限制号码注册新号的现象，利用Gemini deepsearch技术逆向工程这一过程。研究揭示了人工智能在解决实际注册难题中的应用潜力，展示了自动化和网络安全领域的...

Toy2025-12-27前沿阅读(37)去评论

AI时代：好Idea的价值回归

AI技术正重塑开发流程，将用户Idea的快速实现变为现实。过去需要几个人月才能完成的Demo和MVP，现在每天都能高效产出，大幅降低了试错门槛。许多曾被成本障碍淘汰的Idea，如今有机会被重新评估和尝试。然而，从开发到上架、用户使用再到变现...

Toy2025-12-27前沿阅读(40)去评论

自制谷歌NotebookLM：漫画翻译与RAG知识库开发心得

本文分享了Saber-Translator项目，一个基于AI技术的漫画翻译与智能分析工具。作者详细介绍了如何复刻谷歌NotebookLM的功能，通过多模态模型处理漫画图片，优化批处理流程以实现剧情连贯的文本描述。系统构建了RAG知识库，采用...

Toy2025-12-27前沿阅读(36)去评论

开源Qwen3-ASR免费语音识别模型发布

Qwen3-ASR是一个开源的语音识别工具，兼容OpenAI API接口，提供免费使用方案，适合开发者和研究人员。用户可通过Docker快速安装，支持多种模型如qwen3-asr和qwen3-asr:itn，后者启用逆文本标准化。文章详细介...

Toy2025-12-27前沿阅读(44)去评论

AI Prompt 迁移适配：征集稳定样例

作者正在开发一套 AI Prompt 迁移适配方案，通过原 prompt 经中间件转换，生成适配新模型的 prompt，以减少迁移工作。实验中，使用 Gemini 和 GPT 生成的 prompt 效果不稳定，现公开征集正在稳定使用的 pr...

Toy2025-12-27前沿阅读(62)去评论

上一页
1
···
7
8
9
10
11
12
13
...
下一页
共 35 页

前沿哨所

Radicle：基于Git的去中心化P2P代码协作平台

Radicle 是一个基于 Git 构建的开源、点对点代码协作堆栈。与 GitHub 等中心化平台不同，Radicle 无单一实体控制网络，代码库在对等节点间去中心化复制。它采用本地优先策略，支持离线工作，并利用公钥加密确保数据安全。用户拥有完全的数据主权，可自定义扩展协作流程，提供 CLI、Web 及桌面客户端，旨在构建抗审查、高韧性的代码协作环境。

原文链接：Hacker News

15分钟前
基于 Gemini 的免费 AI PDF 阅读器 InsightPDF，助力论文高效阅读

InsightPDF 是一款基于 Google Gemini 模型开发的免费 AI PDF 阅读器。该工具专为需要阅读学术论文或长文档的用户设计，允许用户通过自然语言聊天与文档交互，精准定位并提取 PDF 中的关键内容。用户可选择使用自己的 API Key 或通过 Google 账号直接登录使用。项目已在 GitHub 开源，支持见解提取、内容总结和智能文档搜索，旨在利用大模型能力降低文献阅读门槛。

原文链接：Linux.do

15分钟前
搜狗输入法更新AI语音：接入混元7B，但宣传功能缺席

搜狗输入法近期推送更新，引入了腾讯混元7B模型作为新后端。然而实测发现，应用界面未见明显变化，且宣传图重点展示的“快速更改人称”功能在实测中并未找到。对比豆包等竞品，虽然集成了新模型，但在具体体验上仍需打磨，被指存在货不对板的情况。

原文链接：Linux.do

15分钟前
Codex CLI 代理设置失效？罪魁祸首竟是 .env 隐藏配置

近期用户更换代理服务器后，Codex CLI 频繁报错连接旧IP。尽管进程环境变量显示配置为新代理，但 Trace 日志揭示了程序仍在尝试访问旧地址。经排查，根源在于配置文件 ~/.codex/.env 中残留的旧代理设置，其优先级干扰了系统环境变量。本文详细记录了通过日志分析与全盘搜索定位隐形配置冲突的过程，为开发者排查类似代理故障提供了宝贵经验。

原文链接：Linux.do

15分钟前
Gemini获赞“活人感”十足，生动比喻展现AI高情商交互

近日，有科技社区用户在向 Gemini 询问“学习率”等专业技术概念时，得到了一个生动形象的比喻回答。这一回答因其极强的“活人感”引发了用户热议，并由此展开了对 Gemini 训练语料及其交互能力的讨论。这种通俗易懂且富有语境的回答方式，反映了当前大模型在自然语言理解与拟人化交互方面的显著进步。

原文链接：Linux.do

15分钟前
微软向FBI提供加密密钥，BitLocker隐私设计遭专家猛批

福布斯报道，微软在一起关岛失业欺诈案中，应FBI搜查令要求提供了BitLocker加密恢复密钥。这揭示了微软在默认加密架构上的隐私漏洞：出于“便利”考虑，微软允许用户将密钥备份至云端，而其自身掌握这些密钥，使其能响应执法机构请求。相比之下，Apple和Meta采用的技术设计使其无法获取用户密钥。专家严厉批评微软的做法，认为其应承担保护用户数据的责任，并警示该漏洞可能被各国政府利用，威胁用户隐私安全。

原文链接：Hacker News

1小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始