python之selenium访问网站被反爬限制封锁解决方法 - 51Testing软件测试网

软件测试网软件测试培训软件测试论坛测试解决方案文章资料精选软件测试博客软件测试招聘

文章资料精选

python之selenium访问网站被反爬限制封锁解决方法

发表于：2023-6-20 09:14

字体：大中小 | 上一篇 | 下一篇 | 我要投稿

作者：离歌来源：知乎

#

selenium

#

自动化测试框架

　　在访问某些网站时，selenium webdriver 开启网页失败，被发现为爬虫，目前我碰到的有效解决方案是：

　　1、因为selenium在命令行手动开启后的谷歌 浏览器加了一些变量值，比如window.navigator.webdriver，在正常的谷歌浏览器是undefined，在selenium打开的谷歌浏览器是True，然后对方服务器就会下发js代码，检测这个变量值给网站，网站判断这个值，为True就是爬虫程序就封锁你的访问，如下图。

　　实现代码是在请求之前改变一些参数，绕过检测，具体细节可以自己了解下网站检测selenium的原理，需要设置对应其它的值都可以加：

　　# 下面代码本人是基于命令行打开再接管浏览器窗口，

　　from selenium import webdriver

　　options = webdriver.ChromeOptions()

　　

　　# chrome在79版之前用下面两行代码

　　#options.add_experimental_option("excludeSwitches", ["enable-automation"])

　　#options.add_experimental_option('useAutomationExtension', False)

　　

　　# -我是最新谷歌浏览器版本，chrome在79和79版之后用这个，

　　driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {

　　 "source": """

　　 Object.defineProperty(navigator, 'webdriver', {

　　 get: () => undefined

　　 })

　　 """

　　})

　　driver.get("这里填写你被反爬网站的链接")

　　本文内容不用于商业目的，如涉及知识产权问题，请权利人联系51Testing小编(021-64471599-8017)，我们将立即处理

《2023软件测试行业现状调查报告》独家发布~

热门推荐

搜索风云榜

测试技术了解

2023测试行业调查报告

挣点稿费

AI与软件测试

关注51Testing

相关阅读

热门标签

博文推荐

热点聚焦

最近讲堂

联系我们

快捷面板站点地图联系我们广告服务关于我们站长统计发展历程

法律顾问：上海兰迪律师事务所项棋律师
版权所有上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈：webmaster@51testing.com; 业务联系：service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号