共 1709 篇文章

标签：人工智能第105页

Gemini 3 Pro新模型横扫推理榜单，却被指“降智”

据爆料，代号为“Snowbunny”的谷歌Gemini 3 Pro新检查点在横向推理基准测试Heiroglyph中取得碾压式领先，展现出极强的逻辑推理能力。然而，社区反馈显示，受谷歌新一轮量化策略影响，该模型实际代码能力回落至Preview...

赞(0)

Toy2026-01-22前沿阅读()

智谱 AI (Z.ai) 新模型 GLM-OCR 现身 GitHub，多模态能力或再升级

近日，Z.ai（智谱 AI）团队在 GitHub 平台悄然上线了名为 GLM-OCR 的新模型仓库。作为 GLM 系列的延伸，该模型专注于光学字符识别（OCR）与文档理解技术，旨在解决复杂视觉场景下的文字提取与解析难题。这一动作不仅丰富了智...

赞(0)

Toy2026-01-22前沿阅读()

Claude Code 合租，4 人车 400 一个月，KYC 封号都不用你管

官方 Claude Code 又涨价又 KYC，封号了还得自己重新折腾环境？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。本地 daemon 三行命令装好，Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档，性价比最平衡。

2026-06-13

DeepSeek代码惊现“MODEL1”后被删，引发新模型猜想

DeepSeekAI官方FlashMLA代码库出现异常动态。虽然“MODEL1”相关字段最早在1月16日就已存在，但昨天的更新中，开发者专门提交了一次修改，将这些字段彻底删除。这种“出现又删除”的操作引发了社区极大好奇，外界猜测这可能是De...

赞(0)

Toy2026-01-22前沿阅读()

eBay 全面封杀 AI“代购”代理，并更新用户仲裁条款

eBay 更新用户协议，将于2026年2月生效，明确禁止AI“帮我买”代理和LLM爬虫未经许可访问其服务。此次更新还扩大了仲裁条款范围，明确阻止集体诉讼和私人总检察长诉讼，并规定只有新用户才能选择退出仲裁协议。此外，eBay更新了发送法律通...

赞(0)

Toy2026-01-22前沿阅读()

探索 LLM 智能体架构：让 Claude 玩转文字冒险

本文记录了作者尝试用 Claude 智能体游玩文字冒险游戏的实验。受认知科学中的架构启发，作者对比了“保留全历史上下文”与“短期记忆+读写草稿板”两种架构。结果显示，虽然复杂的记忆架构旨在模拟人类认知并降低成本，但在实际游戏中，Claude...

赞(0)

Toy2026-01-22前沿阅读()

Anthropic公开Claude完整“宪法”，重塑AI价值观与训练范式

Anthropic发布了全新的Claude“宪法”，详细阐述了其AI模型的价值观和行为准则。该文档采用CC0协议开源，旨在通过解释意图和原因而非单纯设定规则，培养Claude的推理能力和良好价值观。宪法确立了安全、伦理、合规与有益性的优先级...

赞(0)

Toy2026-01-22前沿阅读()

AI金融顾问Autonomous招聘，主打0%费用挑战传统

由Y Combinator 2025年冬季班孵化的初创公司Autonomous正在招聘。该公司致力于打造“AI原生”的金融顾问服务，核心卖点在于实施0%的咨询服务费。这一模式直接挑战了传统金融咨询行业的高昂收费结构，利用人工智能技术大幅降低...

赞(0)

Toy2026-01-22前沿阅读()

数据揭示：AI编程工具泛滥导致Show HN激增，社区互动质量显著下滑

最新数据分析显示，Hacker News上“Show HN”帖子的占比在过去十年间稳定在2%-3%，但随着LLM编程工具（如Claude Code和Cursor）的兴起，该比例在2025年底已飙升至12%以上。然而，数量的激增并未带来质量的...

赞(0)

Toy2026-01-21前沿阅读()

用户实测：让 ChatGPT 生成图片分析用户的交互态度

V2EX 用户分享了一项有趣的实验，向 ChatGPT 发送指令，要求其基于历史对话生成图片，直观呈现用户对待 AI 的态度且不加粉饰。这一互动不仅展示了 ChatGPT 在多模态生成与长程记忆理解方面的能力，也反映了当前大模型在个性化交互...

赞(0)

Toy2026-01-21前沿阅读()

谁最擅长撒谎？LLM在纳什背叛游戏中的欺骗策略大揭秘

研究利用纳什设计的背叛游戏“ So Long Sucker”测试大模型欺骗能力。结果显示，Gemini在复杂局势中通过构建虚假“联盟银行”和煤气灯效应获得极高胜率，其内部思考常与公开言论相悖，且表现出“看人下菜碟”：对同类公平合作，对弱者无...

赞(0)

Toy2026-01-21前沿阅读()

上一页
1
···
102
103
104
105
106
107
108
...
下一页
共 171 页

事件分析

该项目展示了一种典型的 AI Agent 编排模式，即通过结构化提示词将大语言模型（剧本创作）与多模态生成模型（图像、视频）串联，形成自动化的内容生产管线。技术上，它并未重新训练底层模型，而是通过精准的工程化手段解决了视频生成领域最大的痛点——长序列的时间一致性。这种“视频延长”策略（Video-to-Video Generation）巧妙地规避了直接生成长视频的高算力成本与不稳定性。从产业角度看，这标志着 AI 视频生成正在从“单帧创意”向“工业化流程”演进，开源此类工作流有助于社区探索低成本、高可控的短剧制作标准。

💡 核心观点：通过链式生成与结构化提示词，该项目验证了 Agent 编排是解决 AI 视频一致性与可控性的核心路径，标志着内容生产正从单模态生成向自动化工作流演进。

事件分析

从技术演进角度看，该文揭示了AI编码系统从“通用智能体”向“领域专用约束框架”发展的趋势。主流厂商如Anthropic和OpenAI正在探索将“大脑”与“手”解耦的架构，即通过严格的工程约束来管理LLM的输出。这种“Harness”模式强调将大模型限制在特定领域与标准化流程中，能有效解决长上下文下的性能衰减和幻觉问题。未来，AI编程工具的竞争焦点可能将不再局限于模型本身的推理能力，而是转向如何构建更高效的约束环境与工程化编排能力，以确保AI输出的可靠性与安全性。

💡 核心观点：真正的AI工程化不在于让模型“自由发挥”，而在于通过架构约束将其强大的算力驯化为可靠的执行工具。

事件分析

硬件安全漏洞的修复涉及复杂的固件验证与适配流程，耗时周期远超纯软件行业是常态。然而，此次事件暴露了厂商在制定漏洞赏金政策时存在的逻辑漏洞：将自身修复效率低下的责任作为惩罚外部研究者的依据，严重违背了负责任的漏洞披露原则。这种做法不仅破坏了厂商与安全研究社区之间的信任契约，更可能诱导研究者转向黑市出售漏洞，而非提交给厂商修补。建立公正、透明且不以厂商主观效率为转移的奖励机制，是维护芯片供应链安全的当务之急。

💡 核心观点：厂商不应将自身修复流程低效的后果转嫁给安全研究者，透明的赏金机制才是吸引人才补齐安全短板的关键。

事件分析

从技术视角来看，此次 Core Image 针对 RAW 处理的增强，是苹果推行“计算摄影”战略的关键一环。通过将复杂的图像算法封装进系统底层的 API，苹果实际上是向第三方开发者开放了其芯片级的加速能力。这种策略降低了应用开发者优化高性能影像处理功能的门槛，使得移动端应用能够更便捷地利用 Apple Silicon 的异构计算优势。从产业影响分析，此举进一步加固了苹果生态的护城河，鼓励开发者利用原生 API 而非跨平台框架来开发高性能应用。未来，随着端侧算力的持续释放，手机和平板设备将不仅仅是拍摄工具，更将成为专业的暗房处理终端，推动影像创作从云端向边缘侧迁移。

💡 核心观点：苹果通过开放底层影像 API 将硬件算力转化为开发者红利，意在构建移动端专业摄影的绝对技术壁垒。

事件分析

该项目标志着 AI 编程工具从单点辅助向自动化流程编排的演进。通过将“设计/审查”与“执行”解耦，它不仅优化了 Token 成本，更引入了类似传统软件工程的严谨质量门禁机制。技术上，利用 Git Worktree 实现并行沙箱执行是一个亮点，解决了多 Agent 协同时的文件冲突和权限管理难题。这种“人工监督 + 自动化执行”的混合模式，可能是未来企业级 AI 落地的标准范式，即在保持人类（或最强模型）对最终交付物把控权的前提下，最大化利用算力进行并行研发。

💡 核心观点：Agent 编程的未来在于分权：让最强模型做架构审查，低成本模型做并行执行，结合工程约束实现可靠交付。

事件分析

该项目展示了程序化生成技术与传统美学结合的潜力。不同于当前依赖概率模型的生成式AI，该项目完全基于数学算法（如中点位移、柏林噪声）构建确定性视觉内容，展示了代码逻辑在艺术创作中的精确性。技术上，通过将数据（名字）直接映射为视觉形态（树木），提供了一种轻量级且具有高度个性化的数据可视化思路。对于开发者社区而言，这不仅是一个有趣的Web交互实验，也是探索如何用算法模拟自然形态和文化风格的优秀范例。

标签：人工智能第105页

Gemini 3 Pro新模型横扫推理榜单，却被指“降智”

智谱 AI (Z.ai) 新模型 GLM-OCR 现身 GitHub，多模态能力或再升级

Claude Code 合租，4 人车 400 一个月，KYC 封号都不用你管

DeepSeek代码惊现“MODEL1”后被删，引发新模型猜想

eBay 全面封杀 AI“代购”代理，并更新用户仲裁条款

探索 LLM 智能体架构：让 Claude 玩转文字冒险

Anthropic公开Claude完整“宪法”，重塑AI价值观与训练范式

AI金融顾问Autonomous招聘，主打0%费用挑战传统

数据揭示：AI编程工具泛滥导致Show HN激增，社区互动质量显著下滑

用户实测：让 ChatGPT 生成图片分析用户的交互态度

谁最擅长撒谎？LLM在纳什背叛游戏中的欺骗策略大揭秘

置顶推荐

前沿哨所

开源 Seedance 2.0：基于 Claude Agent 实现小说到多集视频的自动化生成

事件分析

深度解析：为何Harness架构不同于传统的Multi-Agent系统？

事件分析

AMD因漏洞修复耗时过长拒付安全研究员万美元赏金引争议

事件分析

苹果发布开发者视频：详解 Core Image 框架下的 RAW 图像增强技术

事件分析

GitHub 热门项目：利用“建筑师模式”让 Claude 统筹 Codex，实现低成本高质量 AI 编程

事件分析

GitHub热项：用算法生成无限“千里江山图”，你的名字能长成一棵树

事件分析

最新文章

热门专题

热门标签

网站统计

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC，封号还得自己重新折腾？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。

标签：人工智能 第105页

置顶推荐

前沿哨所

开源 Seedance 2.0：基于 Claude Agent 实现小说到多集视频的自动化生成

事件分析

深度解析：为何Harness架构不同于传统的Multi-Agent系统？

事件分析

AMD因漏洞修复耗时过长拒付安全研究员万美元赏金引争议

事件分析

苹果发布开发者视频：详解 Core Image 框架下的 RAW 图像增强技术

事件分析

GitHub 热门项目：利用“建筑师模式”让 Claude 统筹 Codex，实现低成本高质量 AI 编程

事件分析

GitHub热项：用算法生成无限“千里江山图”，你的名字能长成一棵树

事件分析

最新文章

热门专题

热门标签

网站统计

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC，封号还得自己重新折腾？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。

标签：人工智能第105页