AI爬虫请用API,别抓我的HTML!
随着AI技术发展,大量爬虫过度抓取网站HTML内容,不仅效率低下还容易出错。本文作者以自身网站为例,详细介绍了如何通过多种API接口替代HTML抓取。作者网站提供WordPress JSON API、ActivityPub、oEmbed、纯...
随着AI技术发展,大量爬虫过度抓取网站HTML内容,不仅效率低下还容易出错。本文作者以自身网站为例,详细介绍了如何通过多种API接口替代HTML抓取。作者网站提供WordPress JSON API、ActivityPub、oEmbed、纯...
作者基于在真实企业级应用中两年使用GraphQL的经验,提出GraphQL确实解决了过度获取数据的问题,但这一问题在企业环境中往往已通过其他方式解决。经过全面权衡利弊,GraphQL在多数企业设置中可能成为净负面。文章并非否定GraphQL...