空间管理您的位置: 51Testing软件测试网 » cq520131517的个人空间 » 日志

莫愁前路无知己，天下谁人不识君。。。。

爬虫知识带你1

上一篇 / 下一篇 2018-03-14 16:05:34 / 个人分类：python知识精髓

查看( 885 ) / 评论( 0 ) / 评分( 0 / 0 )

python2.7：

# coding:utf-8

import urllib2

from bs4 import BeautifulSoup

url = 'http://www.itest.info/courses' # 定义被抓取页面的url

# 获取被抓取页面的html代码，并使用html.parser来实例化BeautifulSoup，属于固定套路

soup = BeautifulSoup(urllib2.urlopen(url), 'html.parser')

# 遍历页面上所有的h4

for course in soup.find_all('h4'):

# 打印出h4的text属性

print(course.text)

python3.0以上：

# coding：utf-8

import requests

from bs4 import BeautifulSoup

url = 'http://www.itest.info/courses' # 定义被抓取页面的url

# 获取被抓取页面的html代码，并使用html.parser来实例化BeautifulSoup，属于固定套路

soup = BeautifulSoup(requests.get(url).text, 'html.parser')

# 遍历页面上所有的h4

for course in soup.find_all('h4'):

# 打印出h4的text属性

print(course.text)

TAG: beautiful requests urllib2

查看全部评论

用户菜单

我的栏目

标题搜索

日历

数据统计

访问量: 107686
日志数: 91
建立时间: 2017-04-12
更新时间: 2019-08-28

RSS订阅