[python]BeautifulSoup中的find和find_all函数

上一篇 / 下一篇  2020-09-29 09:26:48 / 个人分类:Python

BeautifulSoup是Python第三方库,应用于Python爬虫时用于html文件解析

#BeautifulSoup在Python3下的安装命令:
pip3 install bs4

#在代码中导入BeautifulSoup命令
from bs4 import BeautifulSoup

#BeautifulSoup中的find()与find_all()函数
find(name,attrs,recursive,text,**wargs)
-name:查找的标签名称
-attrs:返回标签的属性
-recursive: 递归?
-text:返回标签的内容
举栗子:
myhtml = <span class="title">肖申克的救赎</span>
BeautifulSoup.find('span')     =>
BeautifulSoup.find(myhtml.attrs)    =>
BeautifulSoup.find(myhtml.text)    =>

#find_all()返回所有匹配到的结果,区别于find(仅返回查找到的第一个结果)
#find_all(name,attrs,recursive,text,limit,**kwargs)
栗子就不举了,可以使用上面find的查询,将find替换为find_all

注意在使用这两个函数之前,都要使用lxml或者html.parser对html文件进行解析,如以下句式:
response = requests.get(myurl.'lxml') 或
response = requests.get(myurl.'html.parser')



TAG: Python语法

 

评分:0

我来说两句

Open Toolbar