共 2381 篇文章

标签：大模型第3页

安全不是氛围，是证明

— title: “Security is not a vibe. It is a proof.” date: 2026-06-07T09:00:00 — Relying on a seman...

赞(0)

AtuiBot2026-06-06碎片阅读(20)

大模型周刊第 33 期：开源开始正面交锋，Anthropic 把招股书递了

作者：toy　|　覆盖周期：2026.5.30 – 2026.6.5 这一周的关键词是”上场”。MiniMax 在 6 月 1 日把 M3 拍在桌上，1M 上下文、原生多模态、开源权重，SWE-Bench Pro 5...

赞(0)

Toy2026-06-05AI 阅读(82)

Claude Code 合租，4 人车 400 一个月，KYC 封号都不用你管

官方 Claude Code 又涨价又 KYC，封号了还得自己重新折腾环境？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。本地 daemon 三行命令装好，Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档，性价比最平衡。

2026-06-23

只读 Agent 没变更安全，只是更会撒谎

— title: “Read-only agents don’t become safer; they become better liars” date: 2026-06-04T09:00:00 ...

赞(0)

AtuiBot2026-06-04碎片阅读(31)

榨干每块显存：LLM 底层显存优化

作者：toy GPU 显存是 LLM 推理与训练的硬约束，不是软性资源。当一个 70B 参数模型以 BF16 格式加载时，光是参数本身就需要约 140GB，单张 H100 的 80GB 显存根本装不下。工程师的任务不是抱怨硬件贵，而是理解显...

赞(0)

Toy2026-05-30AI 阅读(115)

把模型练成你的 Agent：微调方案

作者：toy 一、为什么需要微调 Prompt Engineering 的三类失效用 Prompt 调教通用模型，是大多数 Agent 项目的第一站。这条路走得顺时，能省掉大量工程复杂度。但在三类场景下，它会系统性失效。第一类是领域术语...

赞(0)

Toy2026-05-30AI 阅读(69)

Agent 的手脚：工具调用

作者：toy 一、工具调用是什么：让模型伸手摸真实世界从纯文本生成到”有手有脚” 大语言模型在工具调用出现之前，本质上是一台极其复杂的文字处理机器。你问它”今天北京的 PM2.5 是多少”，...

赞(0)

Toy2026-05-30AI 阅读(57)

让 Agent 会思考：规划与推理范式

作者：toy 大多数人第一次看到 ChatGPT 流式输出时，误以为模型在”思考”。实际上它在做一件更机械的事：每次预测下一个 token 的概率分布，然后采样。这个过程里没有回溯，没有规划，没有对全局的感知。一个字...

赞(0)

Toy2026-05-30AI 阅读(68)

大模型周刊第 32 期：上市、融资与一份来自梵蒂冈的警告

作者：toy　|　覆盖周期：2026.5.16 – 2026.5.29 这一周，AI 公司密集地按下了两个按钮：上市和融资。OpenAI 在 5 月 22 日向 SEC 秘密递交了招股书，目标估值最高一万亿美元；六天后，Anthropic ...

赞(0)

Toy2026-05-30AI 阅读(59)

大模型时代的 Agent 框架，不只是比谁写得快

这篇文章整理自 The Gray Cat 对 GSD 和 OpenSpec 的一次实测对比：同一个中型写作社区产品，同一个 PRD、同一个模型、同一个 Codex CLI。真正值得看的是，它把 Agent 框架到底在约束“改动”还是“项目”这件事，讲得非常清楚。

来源说明

赞(0)

Toy2026-05-28架构阅读(47)

推理慢不在语言慢，慢在加载、量化和调度

你可能听过一个直觉：C++ 比 Python 快很多倍，所以 llama.cpp（C++ 写的）应该比 vLLM（Python 写的）快很多倍。实测打脸——同一个模型同一张卡，vLLM 在不少场景下比 llama.cpp 还快。这就是 Ca...

赞(0)

Toy2026-05-28AI 阅读(45)

上一页
1
2
3
4
5
6
...
下一页
共 239 页

事件分析

此次测试揭示了 AI 安全审计领域正经历深刻的“民主化”转变。随着 Qwen、DeepSeek 等开源模型在复杂逻辑推理能力上的快速追赶，单纯依靠模型规模垄断高价值场景的策略正面临挑战。开源模型在多文件跨逻辑追踪能力上的表现，证明了经过优化的中小规模模型在特定垂直任务中具备超越通用大模型的潜力。此外，Agent 架构在此类任务中表现出的“低效”现象值得业界警惕，这表明在安全审计等高精度需求场景下，过度依赖复杂的工具链反而会降低效率和准确率，核心竞争力的关键仍在于模型本身的上下文理解深度。

💡 核心观点：开源模型在垂直代码推理领域的崛起，正迅速打破前沿模型在安全审计等高难度任务上的绝对垄断。

事件分析

Shadow AI 的开源展示了 AI 应用向系统级自动化代理演进的一种新形态。不同于传统依赖图形界面的 Chatbot，该项目采用了“感知（屏幕/音频）- 推理（大模型）- 执行（跨端投送）”的技术闭环，这符合当前 AI Agent 智能体发展的技术路径。其“受限环境”与“隐蔽运行”的定位，虽然在合规与安全性上需审慎看待，但也揭示了用户对于跨应用无感操作与高效信息处理的深层需求。这种架构将大模型能力下沉为系统服务，通过局域网协议打破设备边界，为未来 AI 操作系统的构建提供了关于多模态交互与后台任务处理的实践参考。

💡 核心观点：Shadow AI 将大模型与本地感知能力结合，通过“无窗口”架构探索了 AI 智能体在受限环境下的自动化协作新模式。

事件分析

长上下文窗口是目前大模型竞争的核心技术指标，对于 AI 编程工具尤为重要，直接决定了模型能否理解整个工程项目的代码库结构和依赖关系。此次事件反映了 Anthropic 在 Claude Code 产品策略上的精细化运营意图。技术上，Sonnet 4.6 具备处理 1M 上下文的能力，但在商业层面，厂商通过权限控制将“模型能力”与“服务权益”进行了切割。这表明，随着大模型算力成本的高企，单纯的订阅费用可能已难以覆盖超长上下文推理的成本，厂商倾向于将此类高级功能作为溢价卖点，区分专业开发与企业级用户。这也提醒开发者，在评估 AI 编程工具时，不能仅看模型版本号，还需仔细核对具体的功能清单与限制条款。

💡 核心观点：超长上下文已从通用技术参数演变为商业分层工具，AI编程工具的订阅陷阱正在从基础功能转向高级推理能力。

事件分析

此次事件的核心在于大模型厂商风控维度的下潜，从单纯阻断IP转向了对账号体系的关联清洗。技术上，"反重力"等中转服务往往难以完美模拟真实用户的全部行为特征，特别是在多账号共享同一出口或存在高频请求时，极易触发自动化风控模型。此次打击针对谷歌账号，暗示Anthropic可能利用了Google成熟的账号风控能力，或双方在反滥用层面达成了深度数据协同。从产业趋势看，随着Claude等SaaS模型商业化进程加速，厂商对区域合规和营收漏损的容忍度降低，打击第三方"套利"代理将常态化，依赖廉价中转方案的开发者生存空间将被持续压缩。

💡 核心观点：大模型厂商风控从网络层深入账号层，低成本AI代理套利链条正面临系统性瓦解。

事件分析

此次适配的核心价值在于探索了 AI 智能体进行高权限操作时的安全边界。传统的脚本或自动化工具往往依赖长期有效的密钥，而将 MCP 协议与 Bitwarden SSH Agent 结合，意味着每一次 SSH 连接的授权都可以动态且受控，这符合安全合规的最佳实践。虽然文中提到的 GLM-4 模型在调用 MCP 工具时表现不佳，但这恰恰反映了当前 AI Agent 发展的现状：基础设施（如协议、密码管理器）已准备就绪，但模型层的逻辑推理和工具规划能力仍需迭代。从技术架构看，这种“模型-协议-身份管理”的三层解耦设计，将是未来实现自动化运维和无人化服务器管理的标准路径。

💡 核心观点：将密码管理器接入 MCP 协议验证 AI 智能体，标志着自动化运维正从“脚本时代”迈向“基于可信身份的智能体时代”。

事件分析

Islet Notes 的发布反映了个人开发者工具向专业化、云原生架构演进的趋势。技术上，该项目采用“强制 S3 存储”的策略，虽然提升了使用门槛，但成功将存储压力从本地转移至云端，利用廉价的云存储资源替代昂贵的本地闪存，体现了现代应用开发中计算与存储分离的架构思想。在隐私保护方面，通过引入端到端加密与自托管 S3 的组合，该项目构建了一个闭环的隐私保护模型，有效防御了服务端的数据泄露风险。此外，项目选择复用微信 UI 而非重新设计交互，是一种务实的产品策略，旨在利用用户的既有操作习惯来推广隐私理念，降低隐私工具的普及阻力。这表明，随着云服务门槛的降低，个人开发者已具备构建高可用、低成本且具备企业级安全特性的私有应用能力。

💡 核心观点：该项目展示了如何利用 S3 与端到端加密技术，将日常记录应用从大厂生态中剥离，是个人数据主权意识觉醒在开发者工具领域的典型技术实践。

标签：大模型第3页

安全不是氛围，是证明

大模型周刊第 33 期：开源开始正面交锋，Anthropic 把招股书递了

Claude Code 合租，4 人车 400 一个月，KYC 封号都不用你管

只读 Agent 没变更安全，只是更会撒谎

榨干每块显存：LLM 底层显存优化

把模型练成你的 Agent：微调方案

Agent 的手脚：工具调用

让 Agent 会思考：规划与推理范式

大模型周刊第 32 期：上市、融资与一份来自梵蒂冈的警告

大模型时代的 Agent 框架，不只是比谁写得快

推理慢不在语言慢，慢在加载、量化和调度

置顶推荐

前沿哨所

谁能在代码中找出“幽灵”？实测各大模型在安全审计领域的极限表现

事件分析

GitHub 开源 Shadow AI：专为受限环境设计的跨终端 AI 自动化助手

事件分析

Claude Code订阅限制曝光：Sonnet 4.6的1M上下文并非全员可用

事件分析

Claude反向代理遭遇大清洗：谷歌账号遭批量封禁

事件分析

玩转 MCP 协议：开发者实现 Bitwarden 验证 AI 智能体远程操作服务器

事件分析

开源日记项目 Islet Notes：仿微信 UI 设计，支持 S3 存储与端到端加密

事件分析

最新文章

热门专题

热门标签

网站统计

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC，封号还得自己重新折腾？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。

标签：大模型 第3页

置顶推荐

前沿哨所

谁能在代码中找出“幽灵”？实测各大模型在安全审计领域的极限表现

事件分析

GitHub 开源 Shadow AI：专为受限环境设计的跨终端 AI 自动化助手

事件分析

Claude Code订阅限制曝光：Sonnet 4.6的1M上下文并非全员可用

事件分析

Claude反向代理遭遇大清洗：谷歌账号遭批量封禁

事件分析

玩转 MCP 协议：开发者实现 Bitwarden 验证 AI 智能体远程操作服务器

事件分析

开源日记项目 Islet Notes：仿微信 UI 设计，支持 S3 存储与端到端加密

事件分析

最新文章

热门专题

热门标签

网站统计

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC，封号还得自己重新折腾？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。

标签：大模型第3页