网站反爬虫升级:应对LLM训练数据爬虫激增
随着2025年初大量爬虫涌入网站收集LLM训练数据,网站管理员不得不加强反爬虫措施。这些爬虫多使用旧的浏览器用户代理,特别是Chrome版本,给网站服务器带来巨大压力。文章详细介绍了作者如何通过识别可疑浏览器版本来阻止这些爬虫,并特别指出a...
随着2025年初大量爬虫涌入网站收集LLM训练数据,网站管理员不得不加强反爬虫措施。这些爬虫多使用旧的浏览器用户代理,特别是Chrome版本,给网站服务器带来巨大压力。文章详细介绍了作者如何通过识别可疑浏览器版本来阻止这些爬虫,并特别指出a...