早前GitHub因为失误部署了屏蔽所有中国IP地址的规则
如果之前是失误那现在肯定就是故意的了,GitHub部署的新规则会对用户语言进行检查,如果用户使用的是中文(仅限zh_CN)则可能会触发限制而被限制访问,不过从情况来看GitHub应该是为了反爬虫的(例如某SDN无差别拉取GitHub上的项目搬到自家平台)。
从测试情况来看GitHub将多个条件整合用来触发限制,例如首先检查GitHub的常规规则(包括黑名单IP和UA),然后检测IP地址质量,以上两个条件全部通过后再检查第三个条件,也就是浏览器请求头的语言部分是否包含zh_CN,如果检测到用户使用的中文则会返回错误。
也就是说GitHub并没有针对特定区域的IP进行封禁,如果用户IP质量没问题的话则不会触发语言检测,因此如果用户使用企业代理软件访问GitHub的话就可能因为IP地址质量差(脏IP)而触发语言检测。
从这些情况来看GitHub大概率是为了反爬虫和反抓取,目前大量AI爬虫对GitHub疯狂抓取用来训练模型,这种抓取行为不仅会给GitHub服务器造成负担,也会浪费大量流量造成GitHub成本增加。
如果用户并非爬虫并且访问受到影响,那也可以进行针对性的解决:
1.简单方法就是直接修改请求头将语言修改为en_US等其他未被限制的语言
2.更换质量更好的IP地址避免触发风控,当然更换IP地址可能会增加潜在使用成本
不过针对语言的检测很容易被绕过,接下来GitHub很有可能会观察情况并对修改语言的行为进行检测,毕竟反爬虫是个长期工作,GitHub也只能根据爬虫的情况进行针对性的策略调整实现封禁。

相关文章


头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】