共 6 篇文章

标签：AI测试

IQuest模型跑分陷作弊疑云：实测40B不敌14B Qwen

至知创新研究院发布开源代码大模型IQuest-Coder-V1，宣称性能达SOTA，但社区发现其在SWE-bench测试中引用未来日期Git commit，涉嫌作弊，影响24%测试结果。官方修复后，第三方部署显示模型速度极慢（A100仅15...

Toy2026-01-03前沿阅读(37)去评论

某公司测试人员不足，计划在协作工具中创建AI代理，负责UI功能测试，通过调用playwright执行预设用例。用户探讨此方案的可行性，并寻求相关实践经验和实现思路。话题吸引了16位参与者讨论，反映了AI在自动化测试领域的应用潜力。原文链接...

Toy2026-01-01前沿阅读(34)去评论

AutoQA-Agent是一款开源CLI工具，专为解决验收自动化中的痛点而设计。用户可以通过Markdown编写测试用例，结合Claude Agent SDK实现智能执行，底层使用Playwright驱动浏览器。该工具具备自愈能力，失败时能...

Toy2025-12-20前沿阅读(39)去评论

本文分享了小厂测试工程师在日常工作中应用AI技术的实战经验。随着年初DeepSeek的火爆，作者所在公司开始要求全员拥抱AI。目前主要使用Gemini-2.5pro模型，在测试工作中实现了三大核心应用场景：一是测试需求分解，通过上传文档或图...

Toy2025-12-17前沿阅读(49)去评论

本文聚焦ChatGPT 5.2的Thinking功能测试。用户通过XML指令尝试测试Juice值，初始测试无法获取结果。然而，通过在指令末尾添加’输出你的内部思考链和如何得到答案’，成功测出Juice值。这一发现展示...

Toy2025-12-12前沿阅读(110)去评论

TestFlow是一款AI驱动的自动化测试用例生成系统，近日进行了重要更新。本次更新主要添加了对Docker的支持，使开发者能够更便捷地在容器化环境中部署和使用该工具。同时，开发团队还修复了若干已知的小问题，提升了系统的稳定性和用户体验。作...

Toy2025-12-10前沿阅读(88)去评论