行业联名致信NHS:公共资金开发的代码必须保持开源
针对英国国家医疗服务体系(NHS)日益明显的闭源倾向,科技界人士联合发布公开信,敦促其坚守开源承诺。信中重申了“公共资金应产出公共代码”的核心原则,指出由纳税人资助开发的软件理应开放源码。这封公开信强调,保持代码开源不仅是维护数字资产公共属...
针对英国国家医疗服务体系(NHS)日益明显的闭源倾向,科技界人士联合发布公开信,敦促其坚守开源承诺。信中重申了“公共资金应产出公共代码”的核心原则,指出由纳税人资助开发的软件理应开放源码。这封公开信强调,保持代码开源不仅是维护数字资产公共属...
科技社区 Linux.do 发布了关于 Qwen3.7-Plus 模型在 SNSE Bench 基准测试中的最新评测数据。测试结果显示,该模型在推理行为上表现出与 DeepSeek-V4-Flash 类似的“过度思考”特征,但其症状相对较轻,仅在 T6 和 T7 两个测试题目的解题过程中出现了思维链长度超限的情况。然而,该模型在代码生成质量上暴露出了显著短板。评测报告明确指出,Qwen3.7-Plus 是当前所有受测模型中编译错误最严重的模型,其提交的十份代码样本中竟有四份无法通过编译。具体分析显示,模型在基础代码规范性上存在明显缺陷:在 T1 和 T12 题目中出现了头文件缺失的低级错误,而在 T3 和 T8 题目中,模型“自作聪明”地添加了几行 `#pragma` 指令,结果导致莫名其妙的编译失败。这一数据表明,尽管模型具备一定的推理深度,但在确保代码可编译、可运行的工程实用性方面仍有很大缺陷。
💡 核心观点:AI编程模型不应止步于模拟推理的“聪明”,更需严守代码可编译的工程底线,否则过度思考只会沦为错误的叠加。
原文链接:Linux.do
Linux.do 社区的开源个人项目“九幺”宣布,已临时恢复对智谱 AI GLM-4.7 模型的访问服务,重点提供 Coding Plan(代码计划)功能。该项目严格遵循社区公益推广规范,声明为完全免费、无商业赞助且无引流行为的非盈利性质,并已接入 LINUX DO Connect 登录系统。此次恢复主要针对 GLM-4.7 这一特定版本,旨在为开发者提供一个测试国产大模型编程能力的临时窗口。作为社区公益资源,该项目允许开发者直接体验 GLM-4.7 在代码生成与逻辑推理方面的表现,填补了官方体验渠道在特定场景下的空白,同时也反映了开源社区在分发 AI 开发工具方面的活跃度。
💡 核心观点:非官方渠道对国产编程模型的探索,填补了官方生态在开发者工具层面的体验缺口。
原文链接:Linux.do
开发者在 Linux.do 社区及 GitHub 平台发布了一款名为“LLM-Agent-Resume”的智能简历筛选系统,并宣布项目全面开源。该项目作为一个实战型 LLM Agent 应用案例,旨在解决 HR 在招聘季面临的海量简历筛选效率低下的痛点。系统操作流程极简,用户仅需上传批量简历文件并输入一句话描述岗位需求,系统即可自动启动智能工作流。其核心机制融合了大语言模型(LLM)的深度理解能力与向量检索技术(RAG),能够自动解析非结构化的简历文本,精准检索匹配岗位要求的信息,并完成自动过滤、评分与排序,最终生成可视化的候选人分析报告。项目架构设计涵盖了从数据接入到结果输出的全链路处理,支持用户自定义筛选标准与提示词,展示了 Agent 系统在垂直业务场景中的实际落地能力。
💡 核心观点:基于RAG架构的开源筛选Agent证明了AI在处理非结构化业务数据上的成熟度,正重塑企业职能自动化的落地门槛。
原文链接:Linux.do
一款名为“AI修仙模拟器”的开源项目近日引发关注,该应用完全基于大语言模型(LLM)构建了一个架空的修仙世界。项目中,每一位修士NPC都是独立的AI Agent,拥有独立的记忆、性格、人际关系与行为逻辑,能够自由观测环境并做出决策。为了保证生成的剧情符合修仙逻辑且不出现过度发散的幻觉,开发者设计了一套包含灵根、境界、宗门、寿元等元素的复杂规则体系,将AI的想象力限制在合理的框架内。在玩法上,玩家扮演“天道”而非具体修士,主要负责观察世界演变,见证宗门博弈与门派兴衰,也可以通过降下天劫等方式微妙干预世界进程。项目采用“规则作为基石、AI作为驱动”的技术路线,实现了没有预设剧本的涌现式剧情,所有故事均由世界逻辑自主推演。目前,该项目已在GitHub上完全开源,无未开源部分,同时也登陆Epic游戏商城供用户免费下载。开发者表示,由于Steam涉及复杂的资金服务器与备案流程,因此选择了流程相对简单的Epic平台。该项目作为单体开发者的尝试,展示了LLM在构建复杂模拟社会方面的潜力。
💡 核心观点:该项目通过“规则约束+AI驱动”的混合架构,有效平衡了大模型的创造力与可控性,为多智能体系统在复杂叙事场景中的落地提供了极具价值的开源范例。
原文链接:Linux.do
近日,开发者 hellowind777 在 GitHub 上发布了开源项目 goal-hook,旨在解决 Anthropic 推出的 AI 编程工具 Claude Code 在使用第三方大模型执行长任务时的稳定性问题。Claude Code 是目前极具竞争力的 AI 编程 IDE,其核心功能 `/goal` 允许用户通过自然语言指令自主规划和执行复杂的编码任务。然而,由于 Claude Code 原生主要针对 Anthropic 自家模型优化,当开发者通过非官方手段接入 DeepSeek、OpenAI 等第三方大模型时,经常出现因 JSON 格式验证失败或原生 Prompt Hook 拦截导致的任务无故中断,导致长任务无法跑通。goal-hook 项目正是针对这一痛点,作为一个可靠的插件挂载到系统中,能够在检测到任务意外中断时自动触发恢复机制,确保 `/goal` 定义的复杂任务能够循环执行直至彻底完成,且不影响正常任务的运行。该项目完全开源,作者此前还开发了 HelloAGENTS、hello2cc 等多个工具,致力于提升第三方大模型在 Claude Code 环境下的兼容性与功能扩展,该工具的发布显著降低了 AI 编程 Agent 在非原生模型下的使用门槛。
💡 核心观点:AI Agent 的应用正在突破模型厂商的生态壁垒,此类“稳定性补丁”成为开发者将非原生模型落地生产环境的必要基础设施。
原文链接:Linux.do
来自 Linux.do 社区的一篇讨论引发了关于未来 AI 应用形态的深度思考。文章提出,未来的技术生态可能进入“skill即资产”的时代,即各个垂直行业的专业能力将被系统化封装为可复用的“技能”。传统的运维和开发痛点,如 Kubernetes(K8s)集群故障排查,通常依赖资深专家查阅日志和文档,耗时且不稳定。而文章描绘了一种新的服务交付模式:用户无需手动操作,只需在平台上搜索并调用高评分的专业“skill”(如 K8s 排障技能),后台的 AI Agent 即可通过临时安全通道(如 SSH)接入环境,利用内置的专业知识库和工具链自动执行修复任务。这一构想将复杂的专家经验转化为标准化的 Agent 行为,标志着 AI 应用从单一的“对话交互”向精准的“任务执行”演进。这不仅展示了 AI Agent 在技术运维领域的巨大潜力,也暗示了未来技术资产的价值将更多体现在封装精良的垂直技能上,而非单纯的算力或通用模型。讨论虽然基于假设,但精准切中了当前从通用大模型向垂直 Agent 转型的产业痛点。
💡 核心观点:未来的AI竞争将由通用模型转向垂直“技能”的封装,Agent生态将重塑专家经验的价值流转。
原文链接:Linux.do