Python+Selenium下载原图图片

发表于:2021-4-02 09:24

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:佚名    来源:CSDN

  最近在用selenium爬取一些数据,其中就要攻破验证码,奈何selenium本身没有直接保存图片的功能,经过一番度娘,对网上的方法不是很赞同,大体上有下面两种方法:
  · 整个页面截图,然后根据获取的Element大小切割图像;
  · 使用鼠标和键盘事件模拟另存操作。
  我认为第一种方法再某些情况下可能会造成图片清晰度丢失,因为有些网站的图片是经过css限制了大小展示在页面上,如果截图的话,势必图像像素变小,清晰度降低。第二种方法可以实现,但是太复杂,中间鼠标、键盘还不能有其他动作,抗干扰能力差。
  经过一番思考,我突然想到之前做的一个需求:在一个单页面应用上下载文件。当时是使用window.open实现的,但是新用户在使用的时候浏览器总会拦截,这样的体验不是很好。因此后来又改良了一下,使用XMLHttpRequest请求,返回blob,然后构造一个a标签,填充base64,完成下载,代码如下:
  var url = 'url';
  var xhr = new XMLHttpRequest();
  xhr.open('GET', url, true);
  xhr.responseType = blob;
  xhr.onload = function() {
  if (this.status === 200) {
  varblob = this.response;
  varreader = new FileReader();
  reader.readAsDataURL(blob);
  reader.onload = function(e) {
  vara = document.createElement('a');
  a.download = 'aaa.jpg';
  a.href = e.target.result;
  $(body).append(a);
  a.click();
  $(a).remove();
  }
  }
  };
  xhr.send();

  本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号