selenium获取元素信息常用方法(1)

发表于:2024-4-15 09:28

字体: | 上一篇 | 下一篇 | 我要投稿

 作者:鹅不糊涂    来源:CSDN

  selenium获取元素信息常用方法
  如何使用 Selenium 获取网页元素的信息:
  Selenium 是一个用于 Web 应用程序测试的工具,可以使用它来模拟用户在浏览器中的操作,并进行自动化测试。其中最常见的任务之一就是获取网页元素的信息,我们可以使用 Selenium 提供的方法来获取元素的文本内容、大小、属性值等信息,进而对页面进行分析和处理。
  实例讲解
  案例一
  # 导入必要的库
  from selenium import webdriver
  from selenium.webdriver.common.by import By
  # 创建一个新的 Chrome 浏览器实例
  d = webdriver.Chrome()
  # 打开京东首页
  d.get('https://www.jd.com')
  # 通过 CSS 选择器查找元素,并使用 size 方法获取了元素的大小(即高度和宽度)
  jd_supermarket = d.find_element(By.CSS_SELECTOR, '[aria-lable="京东超市"]')
  print(jd_supermarket.size)
  # 通过 XPath 查找元素,并使用 text 方法获取了超链接的文本内容
  jd_seckill = d.find_element(By.XPATH, '//div/a[4]')
  print(jd_seckill.text)
  # 通过 XPath 查找元素,并使用 get_attribute 方法获取了超链接的 href 属性值
  jd_vipshop = d.find_element(By.XPATH, '//div/div/div[4]/ul/li/a')
  print(jd_vipshop.get_attribute('href'))
  # 关闭浏览器
  d.quit()
  案例二
  判断元素是否可点击
  判断元素在页面上是否可以点击,WebElement对象调用 is_enabled() 方法。
  is_enabled()方法返回一个布尔值,若可点击返回: True 。若不可点击则返回: False 。
  # 导入需要的模块
  from selenium import webdriver  # 导入webdriver模块
  import time  # 导入time模块
  from selenium.webdriver.common.by import By  # 导入By模块
  # 创建一个Chrome浏览器实例
  driver = webdriver.Chrome()
  # 打开百度首页
  driver.get('https://www.baidu.com/')
  # 定位百度首页的地图按钮
  elm = driver.find_element(By.XPATH, '//*[@id="s-top-left"]/a[3]')
  # 判断元素是否可点击
  answer = elm.is_enabled()
  # 打印结果
  print(answer)  # 执行结果:True,故可以点击。
  # 等待3秒
  time.sleep(3)
  # 关闭浏览器
  driver.quit()
  案例三
  判断元素是否可见
  判断元素在页面上是否可见,WebElement对象调用 is_displayed() 方法。
  # 导入selenium模块中的webdriver和By模块
  from selenium import webdriver
  from selenium.webdriver.common.by import By
  # 创建一个Chrome浏览器实例
  driver = webdriver.Chrome()
  # 最大化浏览器窗口
  driver.maximize_window()
  # 打开百度首页
  driver.get('https://www.baidu.com/')
  # 定位到百度地图按钮
  elm = driver.find_element(By.XPATH,'//*[@id="s-top-left"]/a[3]')
  # 判断百度地图按钮是否可见
  answer = elm.is_displayed()
  print(answer)
  # 关闭浏览器
  driver.quit()
  案例四
  判断元素是否可被选中
  判断元素在页面上是否被选中,WebElement对象调用 is_selected() 方法。
  is_selected() 方法返回一个布尔值,若被选中则返回:True 。若没被选中则返回:False 。
  # 导入selenium模块中的webdriver和By模块
  from selenium import webdriver
  from selenium.webdriver.common.by import By
  # 创建一个Chrome浏览器实例
  driver = webdriver.Chrome()
  # 最大化浏览器窗口
  driver.maximize_window()
  # 打开百度首页
  driver.get('https://www.baidu.com/')
  # 定位到百度地图按钮
  elm = driver.find_element(By.XPATH,'//*[@id="s-top-left"]/a[3]')
  # 判断百度地图按钮是否被选中
  answer = elm.is_selected()
  print(answer)
  # 关闭浏览器
  driver.quit()
  执行结果:False,说明未被选中。
  问题:有一个选项框,本身就是选中状态,如果再点击一下,它就反而变成了未被选中的状态,期望结果是该选项框处于选中状态;当该选项框为未选中状态时,判断去点击选中该选项框;当该选项框处于选中状态时,不做任何操作。
  解决思路: is_selected() 检查是否选中该元素,一般针对单选框,复选框,返回的结果是bool 值,元素处于未选中状态的时候返回 False,元素处于选中状态时返回 True。
  # 导入selenium模块中的webdriver和By模块
  from selenium import webdriver
  from selenium.webdriver.common.by import By
  # 创建一个Chrome浏览器实例
  driver = webdriver.Chrome()
  # 最大化浏览器窗口
  driver.maximize_window()
  # 打开百度高级搜索页面
  driver.get("https://www.baidu.com/gaoji/preferences.html")
  # 定位到“仅简体中文”这个选项
  element = driver.find_element(By.XPATH,"//*[text()='仅简体中文']")
  # 判断“仅简体中文”这个选项是否被选中
  if element.is_selected():
      print("元素已经被选中")
  else:
      print("元素没有被选中")
  # 关闭浏览器
  driver.quit()
  获取url地址
  在 Web 应用自动化测试中,获取当前页面的 URL 地址是一个非常基础的操作。Selenium 提供了多个获取方法来获取当前页面的 URL,下面将分别介绍这些方法的使用。
  使用 current_url 属性
  使用 current_url 属性可返回当前页面的 URL。
  # 导入selenium库中的webdriver模块
  from selenium import webdriver
  # 创建一个Chrome浏览器实例
  driver = webdriver.Chrome()
  # 访问百度首页
  driver.get('https://www.baidu.com')
  # 获取当前页面的URL并打印出来
  current_url = driver.current_url
  print(current_url)
  # 关闭浏览器
  driver.quit()
  使用 execute_script() 方法
  使用 execute_script() 方法可获取当前页面的URL。
  # 导入selenium库中的webdriver模块
  from selenium import webdriver
  # 创建一个Chrome浏览器实例
  driver = webdriver.Chrome()
  # 访问百度首页
  driver.get('https://www.baidu.com')
  # 使用JavaScript语言获取当前页面的URL并打印出来
  current_url = driver.execute_script("return window.location.href")
  print(current_url)
  # 关闭浏览器
  driver.quit()
  使用 window_handles 属性和 switch_to.window() 方法
  如果浏览器中只有一个标签页,可以直接通过 current_url 属性获取当前URL。
  如果打开了多个标签页,此时获取的是当前活动标签页的URL。如果需要获取其他标签页的URL,则可以使用 window_handles 属性获取所有的标签句柄,然后通过 switch_to.window() 方法切换到对应的标签页,再获取URL。
  # 导入selenium库中的webdriver模块
  from selenium import webdriver
  # 创建一个Chrome浏览器实例
  driver = webdriver.Chrome()
  # 访问百度首页
  driver.get('https://www.baidu.com')
  # 在新的标签页中打开Google首页
  driver.execute_script('''window.open("https://www.google.com")''')
  # 获取当前标签页的URL并打印出来
  current_url = driver.current_url
  print(current_url)
  # 获取所有标签页的句柄
  handles = driver.window_handles
  # 切换到新标签页
  driver.switch_to.window(handles[1])
  # 获取当前标签页的URL并打印出来
  current_url = driver.current_url
  print(current_url)
  # 关闭浏览器
  driver.quit()
  使用 page_source 属性
  使用 page_source 属性可获取当前页面的源代码,然后通过正则表达式或其他方法解析出URL。
  # 导入selenium库中的webdriver模块
  from selenium import webdriver
  # 导入re库中的正则表达式模块
  import re
  # 创建一个Chrome浏览器实例
  driver = webdriver.Chrome()
  # 最大化浏览器窗口
  driver.maximize_window()
  # 访问百度首页
  driver.get('https://www.baidu.com')
  # 获取页面源代码
  page_source = driver.page_source
  # 通过正则表达式解析出URL
  url_pattern = re.compile(r'https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+')
  urls = url_pattern.findall(page_source)
  # 遍历所有的URL地址,并打印出来
  for url in urls:
      print(url)
  # 关闭浏览器
  driver.quit()
  本文内容不用于商业目的,如涉及知识产权问题,请权利人联系51Testing小编(021-64471599-8017),我们将立即处理
《2023软件测试行业现状调查报告》独家发布~

关注51Testing

联系我们

快捷面板 站点地图 联系我们 广告服务 关于我们 站长统计 发展历程

法律顾问:上海兰迪律师事务所 项棋律师
版权所有 上海博为峰软件技术股份有限公司 Copyright©51testing.com 2003-2024
投诉及意见反馈:webmaster@51testing.com; 业务联系:service@51testing.com 021-64471599-8017

沪ICP备05003035号

沪公网安备 31010102002173号