反击AI爬虫?GitHub出狠招!中文访问或遭限制
据近期报道,GitHub 已部署新的风控规则。这些规则会检查用户浏览器请求头中的语言部分,如果检测到用户使用的是中文(特指 zh_CN),在特定条件下可能会触发访问限制。
不过,GitHub 并非全面封禁中文用户。平台采用的是一种多条件触发机制:首先会检查常规规则(例如是否为黑名单 IP 或特定的用户代理 User Agent),然后检测用户 IP 地址的质量。只有当这两个条件都通过后,系统才会进一步检查用户的语言设置是否包含 zh_CN。如果用户 IP 地址质量良好,通常不会触发这项语言检测。
分析认为,GitHub 此举很可能是为了反制自动化爬虫和数据抓取行为。当前,大量 AI 爬虫正抓取 GitHub 上的代码和数据用于训练,这不仅给 GitHub 的服务器带来巨大负担,浪费大量流量,也增加了平台的运营成本。
对于可能受到限制的普通中文用户,可以尝试修改请求头,将语言设置改为未被限制的语言(例如 en_US),或者更换一个质量更好的 IP 地址来绕过限制。
值得一提的是,4月13日GitHub网页版在中国大陆地区彻底无法正常访问,随后官方发布回应称,问题是由于一项配置更改造成的意外影响。而此次故障的配置更改已被撤销。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 相知相亲 和合共生 7904408
- 2 饭店老板随手拍菜品被罚45万 7809337
- 3 男生考上火工大 校领导亲手递通知 7711961
- 4 暑期出游如何“避坑” 7618455
- 5 被运往缅甸 男子称不跳车2天挣10万 7523764
- 6 几块钱的手机壳可能有毒或致肾衰竭 7426686
- 7 院士预测广东8级地震?官方通报 7331174
- 8 你的隐私正在快递单上“裸奔” 7232764
- 9 “巧克力”大爷直播钓鱼引万人围观 7136210
- 10 川妹子仿妆张柏芝 本人来了都怀疑 7047847