获取网页title
使用 title 属性
使用 title 属性可直接获取当前页面的 Title。
# 导入selenium库中的webdriver模块
from selenium import webdriver
# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()
# 访问百度首页
driver.get('https://www.baidu.com')
# 获取当前页面的标题并打印出来
title = driver.title
print(title)
# 关闭浏览器
driver.quit()
使用 execute_script() 方法
使用 execute_script() 方法也可以获取当前页面的 Title。
# 导入selenium库中的webdriver模块
from selenium import webdriver
# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()
# 访问百度首页
driver.get('https://www.baidu.com')
# 使用execute_script方法执行JavaScript代码,并返回当前页面的标题
title = driver.execute_script("return document.title")
print(title)
# 关闭浏览器
driver.quit()
使用 find_element(By.TAG_NAME,tag_name)方法
使用 find_element(By.TAG_NAME,tag_name) 方法可实现寻找 head 标签,然后进一步找到 title 标签,从而获取当前页面的 Title
# 导入selenium库中的webdriver模块和By类
from selenium import webdriver
from selenium.webdriver.common.by import By
# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()
# 访问百度首页
driver.get('https://www.baidu.com')
# 使用find_element方法定位页面元素,并获取元素的textContent属性值
title = driver.find_element(By.TAG_NAME, "title").get_attribute("textContent")
print(title)
# 关闭浏览器
driver.quit()
使用 page_source 属性
使用 page_source 属性可获取当前页面的源代码,然后通过正则表达式或其他方法解析出 Title。
# 导入re模块和selenium库中的webdriver模块
import re
from selenium import webdriver
# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()
# 访问百度首页
driver.get('https://www.baidu.com')
# 获取页面源代码
page_source = driver.page_source
# 使用正则表达式解析出页面标题
title_pattern = re.compile(r'<title>(.*?)</title>') # 创建一个正则表达式对象,用于匹配页面标题
title = title_pattern.findall(page_source)[0] # 通过findall方法获取页面标题
print(title)
# 关闭浏览器
driver.quit()
本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理