莫愁前路无知己,天下谁人不识君。。。。

python小编程-----------爬取图片1

上一篇 / 下一篇  2017-11-13 11:12:14 / 个人分类:python 小编程

#!/usr/bin/python
# coding: UTF-8 
import re
import urllib
import urllib2
#通过url获取网页
def getHtml(url):
    # 要设置请求头,让服务器知道不是机器人
    user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
    headers = {'User-Agent': user_agent}
    request = urllib2.Request(url, headers=headers)
    page = urllib2.urlopen(request)
    html = page.read()
    return html
#通过正则表达式来获取图片地址,并下载到本地
def getImg(info):
    reg = r'src="(.+?\.jpg)"'
    imgre = re.compile(reg)
    imglist = imgre.findall(info)
    i = 0
    for imgurl in imglist:
        print imgurl
        #通过urlretrieve函数把数据下载到本地的E:\\images,所以你需要创建目录
        urllib.urlretrieve(imgurl, 'E:\\images\\%s.jpg'%i)
        i += 1
    return imglist
html = getHtml("http://www.qiushibaike.com/imgrank/")
#html = getHtml("http://www.tupianzj.com/sheying/fengjing/")
a = getImg(html)
print len(a)


TAG: 爬虫1

引用 删除 小幼稚园   /   2017-12-02 15:02:39
5
 

评分:0

我来说两句

Open Toolbar