 

共 143 篇文章

标签：大语言模型

破解LLM“短视”困局：为何AI编程更需上下文管理而非全自动

本文反思了当前AI编程领域盲目追求全流程自动化的趋势，指出了LLM因Transformer架构限制而存在的上下文“短视”问题。作者提出了一种基于RPI（研究、计划、实施）三阶段的新工作流，通过人工划分阶段和规范文档串联，有效规避了Claud...

Toy2026-01-23前沿阅读(4)去评论

为什么你的Prompt像在跟AI尬聊?6个让对话成为协作的心法-Toy's Tech Notes

为什么你的Prompt像在跟AI尬聊?6个让对话成为协作的心法

你每天跟AI说3000个字,但AI只听懂了300个。问题不在AI,在于你把协作当成了客服对话。我见过太多人,问日常问题时AI回答还行,但一旦稍微专业一点、维度多一点,AI的回答立刻变成废话连篇的八股文。然后他们会说:”AI...

Toy2026-01-23AI 阅读(7)去评论

Anthropic揭秘“助手轴”：如何在大模型脑中锁定安全人格

Anthropic最新研究通过分析大模型内部神经活动，定义了“助手轴”这一关键概念，用于量化模型在不同人格间的状态。研究发现，模型容易在自然对话中“漂移”偏离安全助手人格，从而产生有害输出。通过限制该轴上的神经激活强度，研究团队成功在不影响...

Toy2026-01-20前沿阅读(18)去评论

Dan Koe写作风格提示词

X上最近出现了Dan Koe的长文，流传非常广。有人说他是新时代的Naval，但也有人说他是高级心灵鸡汤。让AI总结分析了他的写作特征，发现是很有套路，但对于获取流量效果来说，不得不佩服。写了个提示词。给定任意话题，生成一篇Dan K...

Toy2026-01-18碎片阅读(36)去评论

实测AI小说创作：复杂设定致模型“失忆”，Claude被指唯一可用

用户在尝试利用AI进行拥有庞大设定的小说创作时发现，当前主流AI模型及写作工具难以驾驭复杂的上下文逻辑。专用工具在生成过程中会导致高达七成的设定丢失，而Gemini、GPT等模型常因幻觉添加无关设定或改变画风。相比之下，作者实测认为Clau...

Toy2026-01-17前沿阅读(30)去评论

驯服AI的非确定性：如何将大模型无缝融入传统软件系统？

本文探讨了如何将非确定性的AI组件（如LLM）融入确定性软件系统。Eric Evans以代码分析为例，指出LLM擅长分类但不擅长建模，自由生成的分类会导致结果不可比。文章建议采用成熟的标准分类模型（如NAICS）而非让AI自行创造分类体系。...

Toy2026-01-17前沿阅读(23)去评论

Signal创始人推新项目：为AI对话打造端到端加密

Signal创始人Moxie Marlinspike推出开源AI助手Confer，致力将端到端加密技术引入AI领域。Confer利用可信执行环境（TEE）和通行密钥技术，确保用户数据、提示词及AI响应对平台运营方、黑客及执法部门完全不可见。...

Toy2026-01-16前沿阅读(26)去评论

Mozilla旗下any-llm开放Beta：无需自建，支持官方服务器中转

Mozilla旗下项目any-llm近日开放了Beta版本。该项目原本需要用户通过Docker自行构建部署，但现在用户可以直接访问any-llm.ai使用官方托管服务。这意味着用户可能无需自建服务器，而是直接通过Mozilla的服务器进行L...

Toy2026-01-16前沿阅读(27)去评论

泼冷水：生成式AI其实进展不顺，大模型仍难以信赖

尽管生成式AI备受关注，但近期新闻表明其发展并非一帆风顺。文章指出，大语言模型（LLM）的可靠性问题依然严峻，幻觉频发导致其无法被完全信任。作者认为，单纯依靠扩大模型规模难以解决根本缺陷，行业需正视LLM的局限性，并探索更稳健的技术路径，以...

Toy2026-01-14前沿阅读(42)去评论

仅用19世纪数据训练：TimeCapsuleLLM重现维多利亚时代AI

TimeCapsuleLLM是一个独特的语言模型，完全基于1800年至1875年的历史文本从零训练。该项目旨在消除现代偏见，通过“选择性时间训练”技术，让AI真实还原维多利亚时代的语言风格、词汇和世界观。它不仅展示了数据对模型行为的深刻影响...

Toy2026-01-13前沿阅读(46)去评论

DeepSeek开源Engram：引入稀疏性新轴，重塑大模型记忆架构

DeepSeek在GitHub发布了名为Engram的新项目，提出了一种“通过可扩展查找的条件记忆”技术方案。该项目通过引入“稀疏性的新轴”，旨在解决大语言模型在处理长上下文时的记忆瓶颈。Engram利用条件记忆机制，在不显著增加推理成本的...

Toy2026-01-13前沿阅读(63)去评论

精选 AI 学习资源：从 LLM 底层逻辑到 MCP 协议实战路径

该 GitHub 仓库汇集了关于大语言模型底层逻辑、上下文工程以及 Model Context Protocol (MCP) 协议的核心学习资源与实战路径。对于想要深入理解 AI 技术原理及最新协议的开发者而言，这是一份极具价值的系统性学习...

Toy2026-01-12前沿阅读(26)去评论

赋予AI星座性格：观察提示词如何影响智能体决策

该GitHub项目通过给12个AI智能体赋予不同的星座性格提示词，展示了在底层模型相同的情况下，不同的性格设定会导致智能体在处理道德困境时做出截然不同的决策。这不仅是一个有趣的社交游戏，更直观地演示了提示词工程对AI行为模式的强大塑造能力。...

Toy2026-01-12前沿阅读(42)去评论

AI能写出伟大的诗歌吗？从Gwern实验看LLM的创造力边界

本文探讨了LLM是否能创作出伟大诗歌。作者对比了Gwern的“工匠式”实验与Mercor的“工业化”训练。Gwern通过复杂的多阶段提示和模型协作，追求具有特定文化背景的诗歌，试图触及艺术的“伟大”；而Mercor则雇佣诗人构建评分标准，旨...

Toy2026-01-11前沿阅读(36)去评论

谷歌新发现：简单重复提示词，低成本提升大模型性能

谷歌研究团队最新论文指出，在不要求模型进行逐步推理的场景下，简单地将用户输入的提示词重复一遍，即可显著提升主流大语言模型的性能。该技巧利用注意力机制，通过重复输入让前半部分token能“看到”后半部分内容，从而获得更全局的上下文信息，解决因...

Toy2026-01-11前沿阅读(54)去评论

前Mojang团队打造AI游戏Robotopia：语音交互，终结对话树时代

前Mojang和Meta开发者创立的Tomato Cake Inc.发布了3D会话模拟器《Robotopia》。该游戏利用大语言模型（LLM）技术，摒弃了传统对话树，允许玩家通过语音直接与NPC进行实时、开放的互动。游戏结合了沙盒自由与结构...

Toy2026-01-10前沿阅读(28)去评论

Notion AI曝数据外泄漏洞：用户未批准前数据即被盗

Notion AI存在严重数据外泄漏洞，攻击者通过间接提示注入在用户审批前窃取敏感数据。研究人员演示了利用恶意文档（如隐藏提示注入的简历）操纵AI，构造URL外泄招聘跟踪器等机密信息。尽管负责任地披露，Notion将报告标记为“不适用”。专...

Toy2026-01-08前沿阅读(32)去评论

AI崛起：Stack Overflow因毒性环境加速被弃

在2024年前，Stack Overflow是开发者的技术问答圣地，但其有毒环境常让用户受挫。2018年平台承认问题但未改善。最新数据显示使用量从2017年持续下降，2023年后急剧下滑。开发者转向AI工具如LLM，因其响应快且无毒性。作者...

Toy2026-01-08前沿阅读(36)去评论

免费试用去中心化AI：Jatevo送1刀额度不绑卡

Jatevo推出去中心化AI服务，注册无需绑定信用卡即可获得1美元API额度，建议在Claude代码上使用。该服务基于分布式GPU网络，提供低成本、低延迟的LLM推理，用户可免费试用探索前沿技术。虽然额度不多，但积沙成塔，为AI开发者提供实...

Toy2026-01-07前沿阅读(33)去评论

AI智能自我：从人类改进中汲取灵感

2025年AI Agent崛起，目标从对话转向行动。作者观察到AI的工程技巧惊人地类似于人类自我改进：通过写作、内部对话和角色扮演提升智能。AI利用草稿本存储计划，模拟人类记笔记；通过内部思考（如DeepSeek）增强推理；多智能体系统通过...

Toy2026-01-07前沿阅读(35)去评论

1
2
3
4
...
下一页
共 8 页

前沿哨所

谷歌联手Shopify推UCP协议：无需API即可跨平台查询商品

1月11日，谷歌与Shopify联合发布了通用商务协议（UCP），这是一种全新的开放标准。该协议允许应用程序无需通过传统的API或第三方集成，直接跨电子商务平台查询商品信息。AskUCP是该协议的演示工具，展示了其在Shopify平台上的应用潜力。这一创新有望打破现有的电商数据孤岛，大幅降低跨平台数据获取的门槛，不仅提升了开发效率，也为未来AI智能体在电商领域的自主交互提供了基础架构支持。

原文链接：Hacker News

8分钟前
AI赋能个体开发：靠AI完成全流程接单，首入账2万5

一位开发者在业余时间接单，利用AI工具独立完成了从开发到交付的全流程，成功赚取2万5元并获得后续合作。这一案例生动展示了AI技术如何大幅提升个体开发者的生产力与变现能力，印证了AI时代并未淘汰程序员，而是通过人机协作重塑了开发模式，为行业带来了新的机遇与生存法则。

原文链接：Linux.do

9分钟前
谷歌大幅削减AI Studio免费额度，多款模型次数遭腰斩

最新实测显示，谷歌AI Studio对免费API额度进行了大幅调整，多款主流模型调用次数被砍掉一半以上。其中，gemini-3-pro-preview降至约20次，flash版本降至约50次。虽然部分旧版或实验性图像生成模型额度暂未收紧，但整体免费资源的显著缩减，无疑将加重开发者的使用成本与门槛。

原文链接：Linux.do

9分钟前
AI一键美化文件夹：这款开源工具实现Windows图标个性化

一位开发者发布了一款开源工具，利用AI技术实现Windows文件夹图标的一键个性化。该工具通过分析目录结构生成提示词，结合用户选择的风格调用生图模型制作图标，并自动抠图应用。用户只需简单几步操作，即可将单调的黄色文件夹替换为符合内容特征的高颜值图标。该项目不仅提升了桌面美观度，也展示了AI在系统个性化方面的潜力，目前源码已托管至GitHub。

原文链接：Linux.do

9分钟前
Gemini“显示思考”功能现异常：网页端消失但App端正常

有用户报告Gemini Pro账号出现异常，其中一个账号在网页端无法显示“显示思路”功能。经更换浏览器、设备及清除缓存测试，网页版该功能依然消失，但手机App端却能正常显示。该问题仅影响特定账号，且“思考”模式本身可用，仅可视化开关失效，引发关于Gemini功能A/B测试或服务不稳定的讨论。

原文链接：Linux.do

1小时前
0代码+AI构建多平台应用，ComposeFlow深度测评

ComposeFlow 是一款新兴的 AI 驱动可视化应用构建器，旨在解决开发者在使用 Compose Multiplatform 时编写 UI 代码繁琐的痛点。它允许用户通过拖拽界面和 AI 提示词，一键生成支持 Android、iOS、Web 及桌面端的完整 Kotlin 项目。文章详细演示了从安装、创建任务管理应用到导出代码的全过程，虽然该工具目前仍处于早期阶段，存在中文变量名等小瑕疵，但其集成了数据定义、API 编辑等丰富功能，展现了 AI 辅助低代码开发的巨大潜力。

原文链接：Linux.do

1小时前

十年稳如初 — LocVPS，用时间证明实力

10+ 年老牌云主机服务商，全球机房覆盖，性能稳定、价格厚道。

老品牌，更懂稳定的价值你的第一台云服务器，从 LocVPS 开始