智谱autoGLM手机部署测试实录
本文分享了一位科技爱好者在小米手机上部署智谱开源的autoGLM大模型的实战经历。作者详细描述了设置开发者权限、使用ADB控制、本地部署8-9b模型的步骤,并测试了图像识别功能。测试结果显示,模型在app识别上出现错误,未能准确执行指令。作...
本文分享了一位科技爱好者在小米手机上部署智谱开源的autoGLM大模型的实战经历。作者详细描述了设置开发者权限、使用ADB控制、本地部署8-9b模型的步骤,并测试了图像识别功能。测试结果显示,模型在app识别上出现错误,未能准确执行指令。作...
近日,一款基于AI的开源工具实现了图片到可编辑PPT的转换,文本识别率和位置精度接近原版,无需手动调整即可全自动识别。该工具利用PaddleOCR、python-pptx等技术,支持一键安装所需库,启动IOPaint服务去除文字并完美还原背...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
文章描述了一个有趣的AI图片生成测试,探索了中英文语境下的语言歧义。在中文中,“猫”常被用来指代光猫(modem),而英文中“cat”仅指动物,两者毫无关联。研究者用英文指令让AI生成“把网线插到猫”的图片,以测试AI是否能理解这种跨语言差...
开发者推出开源工具,支持多个AI生图网站如Gemini、Google Gemini等。通过拟人操作浏览器实现自动化,支持多窗口并行、多账号隔离和过期自动登录功能。项目基于GitHub开源,旨在为用户提供免费生图方案,降低成本。欢迎技术社区贡...
本文深入解析豆包手机的核心工作机制,通过分析其关键进程、权限设置,并结合日志数据和反编译代码,还原了AI的读屏识别与自动操作逻辑。研究揭示豆包手机作为首个高完成度、强泛化能力的GUI Agent,展现了AI在交互领域的突破性进展,远超普通玩...
用户在AI Studio中与Gemini 2.5 Pro进行了数百次对话,积累了大量个人数据,现希望将这些内容批量导入Gemini中,以便Gemini能全面了解用户历史信息。这涉及数据迁移和工具集成问题,用户寻求自动或半自动方法以避免繁琐的...
近日,一位开发者分享了一个名为’小红书MCP’的开源项目,该项目利用Claude AI实现小红书平台的自动化运营。作者表示,该项目已稳定运行一年多,最初采用HTTP Server架构,后升级为MCP Server,使...
软件开发领域正面临一个有趣的现象:尽管AI工具声称能在几分钟或几小时内生成高质量应用程序,但市场上却鲜见由AI生成的爆款应用。作者将这一现象称为’戈尔曼悖论’,类比物理学中的费米悖论。文章指出,尽管有人宣称我们已进入...
鲍莫尔成本病由经济学家威廉·鲍莫尔于1967年提出,描述了停滞部门(如艺术表演)成本上升而进步部门(如制造业)生产率提高的现象。在人工智能驱动的今天,AI技术正在重塑这一格局。通过机器学习和自动化,AI可以显著提升停滞部门的生产率,降低运营...
本文作者为了凑单购物,设计了一道数学题测试各大AI模型的能力。题目要求使用指定数字(99,39,59等)加起来之和最接近599但要大于599,且必须包含99,数字可重复。测试对象包括Gemini、ChatGPT、Claude、DeepSee...