国产大模型长上下文实测:DeepSeek表现惊艳,Gemini 3 Pro意外垫底
本次评测基于真实医学场景,对比了DeepSeek、Qwen及Gemini系列模型在1M长上下文下的表现。测试让各模型基于50篇文献摘要撰写综述,结果显示DeepSeek凭借新技术在生成质量和连贯性上表现最佳,有效提升了注意力机制;Qwen-...
本次评测基于真实医学场景,对比了DeepSeek、Qwen及Gemini系列模型在1M长上下文下的表现。测试让各模型基于50篇文献摘要撰写综述,结果显示DeepSeek凭借新技术在生成质量和连贯性上表现最佳,有效提升了注意力机制;Qwen-...
本文针对 OpenClaw 搭配 Anthropic 兼容代理调用 Claude 模型时出现的 Prompt Caching 长期不命中问题进行了深度排查。作者发现尽管发送了缓存指令,但由于代理层多后端负载均衡导致 user_id 不稳定,...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
一名用户在技术社区反馈,其 Google 账号因使用名为“opencode”和“antigravity”的非官方第三方客户端,而遭到了 403 错误封禁。据描述,该账号并未用于 2api 或“龙虾”等商业代理服务,仅用于纯开源工具的调用。封...
近期,多名科技爱好者发现,其免费层级的Claude账号在调用最新Sonnet 4.6模型时频繁报错,提示“高流量”及“模型容量不足”(INSUFFICIENT_MODEL_CAPACITY)。关键测试发现,同一账号下旧版Haiku 3.5(...
社区最新测试显示,xAI正在内测的Grok新版本(疑似Small/A8变体)在降低幻觉和联网搜索方面表现优异,但视觉和编程能力仍显不足。技术分析推测,该模型并非运行四个独立模型,而是采用单一权重的多Agent协作架构(Grok、Harper...
针对官方文档仅侧重“使用”而缺乏“实现原理”的痛点,一位开发者花费数月时间深入阅读 OpenClaw 源码,整理出了一套超过 200 篇的实现型技术文档。该文档库分为安装教程、完整工程主线与 AI 核心框架三条路径,涵盖了从 CLI 启动、...
一项针对超过12,000家欧洲企业的新研究揭示了人工智能对经济的真实影响。数据显示,采用AI技术的企业平均劳动生产率提升了4%。值得注意的是,短期内并没有发现AI导致就业减少的证据,打破了“AI抢饭碗”的短期恐慌。然而,AI带来的红利并非雨...
开发者耗时两年打造的桌面应用框架 Electrobun v1 正式发布,旨在解决 Electron 臃肿庞大和 Tauri 语言门槛高的问题。该框架允许开发者仅使用 TypeScript,配合底层 Zig 和 Bun 运行时,构建极小体积、...
AI初创公司StepFun发布了最新大模型Step 3.5 Flash,主打“快到能思考,可靠到能行动”。该模型采用混合专家(MoE)架构,拥有1960亿总参数,但推理时每个Token仅激活110亿参数,显著提升了效率。性能方面,该模型在多...
针对传统移动分析SDK过度收集设备ID和IP地址导致的合规难题,开发者推出了开源项目 Respectlytics。该项目贯彻“数据最小化”原则,仅存储5个必要字段,并立即丢弃IP地址。其架构利用Django和PostgreSQL,摒弃了Ka...
Minecraft Java版官方宣布,为了配合“Vibrant Visuals”更新,游戏核心渲染引擎将从传统的OpenGL全面迁移至Vulkan API。Mojang表示,这是一项浩大的工程,旨在利用现代GPU特性来显著改善视觉效果并提...
本文深入探讨了编程语言开发中关于类型系统的经典选择困境:Hindley-Milner (HM) 还是双向类型检查。作者指出这实际上是一个伪命题,因为双向类型检查本质上是 HM 的超集,而非对立面。真正值得语言设计者关注的核心问题并非算法流派...
在最新的iOS测试版中,国行iPhone被发现已内置了Apple Intelligence的设置入口。用户可以通过语音指令唤起设置,且界面显示支持ChatGPT账户登录。尽管目前点击进入仍会提示“不支持”,实际功能无法使用,但这一发现证实了...
微软宣布Azure SQL和Microsoft Fabric数据库现已支持原生向量搜索,并发布了`langchain-sqlserver`包以实现与LangChain的无缝集成。文章通过《哈利·波特》数据集演示了如何利用这一新特性,结合Az...
备受关注的独立浏览器项目Ladybird已正式关闭关于“Swift 6.0 阻碍”的议题,并明确表示将不再继续推进对Swift编程语言的采用。该项目曾尝试在现有的C++代码库中引入Swift,但遭遇了严重的底层技术瓶颈,包括编译器在处理C+...
针对Ultra账号用户在Antigravity中无法直接使用反代的痛点,本文提出了一种基于决策树的多CLI协同解决方案。该方案将Antigravity作为主IDE并调用Claude模型,同时利用Codex处理前端任务、Gemini负责代码审...
作者开发了一款包含9999个OpenType连字的特殊字体,成功复现了13世纪西多会僧侣使用的Cistercian数字系统。该项目利用字体连字技术,将普通的数字序列(如“1000”)自动替换为对应的古代符号,无需任何JavaScript介入...
BNBrain 项目发布重大更新,打通了智能合约开发的最后一公里。该工具现已实现从“需求澄清”到“自动部署验证”的全流程自动化:用户仅需描述需求并本地签名,AI 即可自动生成代码、编译、上链并完成 BSCScan 验证,无需搭建开发环境。这...
这款名为Straude的创新应用借鉴了健身应用Strava的成功模式,旨在为使用Anthropic最新Claude Code工具的开发者打造一个专属的社交网络。通过Straude,AI编程爱好者可以分享项目成果、互相鼓励,并通过Token使...
文章介绍了一种针对猜词游戏Semantle的高效算法求解器。Semantle基于Google News word2vec向量计算语义相似度,人类玩家往往需要数十次尝试才能通过“语义导航”逼近答案。作者开发的求解器放弃了人类的直观逻辑,转而利...