莫愁前路无知己,天下谁人不识君。。。。
python小编程-----------爬取图片1
上一篇 /
下一篇 2017-11-13 11:12:14
/ 个人分类:python 小编程
#!/usr/bin/python
# coding: UTF-8
import re
import urllib
import urllib2
#通过url获取网页
def getHtml(url):
# 要设置请求头,让服务器知道不是机器人
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5;
Windows NT)'
headers = {'User-Agent': user_agent}
request = urllib2.Request(url, headers=headers)
page = urllib2.urlopen(request)
html = page.read()
return html
#通过正则表达式来获取图片地址,并下载到本地
def getImg(info):
reg = r'src="(.+?\.jpg)"'
imgre = re.compile(reg)
imglist = imgre.findall(info)
i = 0
for imgurl in imglist:
print imgurl
#通过urlretrieve函数把数据下载到本地的E:\\images,所以你需要创建目录
urllib.urlretrieve(imgurl, 'E:\\images\\%s.jpg'%i)
i += 1
return imglist
html = getHtml("http://www.qiushibaike.com/imgrank/")
#html = getHtml("http://www.tupianzj.com/sheying/fengjing/")
a = getImg(html)
print len(a)
收藏
举报
TAG:
爬虫1