准备工作

一台能用的电脑
Chrome浏览器[以该浏览器为例]
下载该浏览器版本对应的Chrome driver[点击前往]
安装Selenium库

 pip install selenium==4.3.0

配置浏览器驱动

将下载好的浏览器驱动放置在Python安装目录下（即Python环境变量配置目录）
或者直接配置系统变量

验证

新建一个Python文件，自行命名，输入以下代码

import time
# 导入selenium包
from selenium import webdriver
# 打开Firefox浏览器
browser = webdriver.Firefox()
# 停留三秒
time.sleep(3)
# 关闭浏览器
browser.quit()

使用

加载指定页面并关闭

import time
# 导入selenium包
from selenium import webdriver
# 打开指定（Firefox）浏览器
browser = webdriver.Firefox()
# 指定加载页面
browser.get("http://www.csdn.net/")
# 设置五秒后执行下一步
time.sleep(5)
# 关闭浏览器
browser.quit()

元素定位

find_element()系列：用于定位单个的页面元素。
find_elements()系列：用于定位一组页面元素，获取到的是一组列表。

通过标签id属性定位

find_element(By.ID,'XX')id定位，根据元素的id属性值定位，最为方便且唯一，但有可能不存在，也可能动态生成。

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 打开指定（Firefox）浏览器
browser = webdriver.Firefox()
# 指定加载页面
browser.get("http://www.csdn.net")
# 通过id属性获取搜索输入框
input_text = browser.find_element(By.ID, "toolbar-search-input")
# 向搜索输入框内输入selenium
input_text.send_keys("selenium")
# 设置停留五秒后执行下一步
time.sleep(5)
# 关闭浏览器
browser.quit()

通过标签name属性定位

find_element(By.NAME,'xx')name定位，根据元素的name属性值定位，定位到的标签不一定是唯一的。

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.baidu.com/")
# 通过name属性选择文本框元素，并设置内容
browser.find_element(By.NAME,'wd').send_keys("selenium")
# 通过通过ID属性获取“百度一下”按钮，并执行点击操作
browser.find_element(By.ID,"su").click()
# 停留五秒后关闭浏览器
time.sleep(5)
browser.quit()

通过标签class属性定位

find_element_by(By.CLASS_NAME,'xx')class定位，根据元素的class属性值定位，但可能受JS影响动态变化。定位到的标签不一定是唯一的。

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.baidu.com/")
time.sleep(2)
# 通过class属性选择元素
browser.find_element(By.CLASS_NAME,'s_ipt').send_keys("CSDN")
time.sleep(2)
browser.find_element(By.ID,"su").click()
# 停留三秒后关闭浏览器
time.sleep(3)
browser.quit()

通过标签tag属性定位

find_element(By.TAG_NAME,'xx')tag name定位，根据元素的标签名定位，定位到的标签不一定是唯一的。

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
time.sleep(2)
# 选择<button></button>标签(搜索按钮),执行点击操作
browser.find_element(By.TAG_NAME, "button").click()
# 停留三秒后关闭浏览器
time.sleep(3)
browser.quit()

通过标签link属性定位

link表示包含有属性href的标签元素，如:linktext可以通过LINK＿TEXT进行定位。
find_element(By.LINK_TEXT,'XX')根据链接文本全匹配进行精确定位。
find_element(By.PARTIAL_LINK_TEXT,'XX')根据链接文本模糊匹配进行定位。

By.LINK_TEXT精确定位

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
# 选择<a href="https://blog.csdn.net/nav/back-end">Python</a>标签,执行点击操作
browser.find_element(By.LINK_TEXT, "Python").click()
# 停留三秒后关闭浏览器
time.sleep(3)
browser.quit()

By.PARTIAL_LINK_TEXT模糊定位

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
# 选择<a href="href="https://blog.csdn.net/nav/ai">人工智能</a>标签,执行点击操作
browser.find_element(By.PARTIAL_LINK_TEXT, "人工").click()
# 停留五秒后关闭浏览器
time.sleep(3)
browser.quit()

通过元素的xpath定位

xpath是一种在XML文档中定位元素的语言
使用绝对路径定位
指的是从网页的HTML代码结构的最外层一层层的写到需要被定位的页面元素为止。
绝对路径起始于/，每一层都被/所分割。
/html/body/div[2]/form/input[3]
注解：
(1)可以用中括号选择分支，div[2]代表的是当前层级下的第二个div标签；
(2)一般情况下较少使用绝对路径的方式做定位，原因在于绝对路径的表达式一般太长，不便于后期的代码维护，代码的微小改变就可能导致这个路径失效，从而无法完成元素定位。

使用相对路径定位
不是从根目录写起，而是从网页文本的任意目录开始写。
相对路径起始于//，//所表示的含义是“任意标签下”
//input[@id='kw']
注解:
(1)示例的含义：在当前页面查找任意目录下的input元素，且该元素的id属性取值为kw
(2)在xpath里，属性以@开头
(3)所选取的属性可以是任意属性，只要其有利于标识这个元素即可
(4)推荐使用相对路径结合属性的这种xpath表达式，它往往更简洁更易于维护
(5)有时候可能会出现一个属性不足以标识某个元素，可以使用逻辑运算符and来连接多个属性进行标识。//input[@xx='aa' and @yy='bb']
(6)有时候一个元素它本身没有可以唯一标识它的属性，这时我们可以找它的上层或者上上层，然后再往下写。//input[@xx='aa']/p

find_element(By.XPATH,'XX')根据元素的xpath表达式来完成定位，可以准确定位任何元素。

表达式	描述
nodename	选取此节点的所有子节点
/	从当前节点选取直接子节点
//	从当前节点选取子孙节点
.	选取当前节点
..	选取当前节点的父节点
@	选取属性
*	选取属性

打开CSDN首页，按F12进入开发者模式，我们可以按照下图所示获取元素的xpath路径，我这里定位的是搜索框的xpath。

点击后会存在与剪切板中，Ctrl+v粘贴到代码中即可使用,这里获取到的是相对路径。

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By

# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
# 通过xpath定位输入框,输入内容selenium
browser.find_element(By.XPATH, '//*[@id="toolbar-search-input"]').send_keys('selenium')
# 停留五秒后关闭浏览器
time.sleep(5)
browser.quit()

通过css选择器定位

find_element(By.CSS_SELECTOR,'XX')根据元素的css选择器来完成定位，可以准确定位任何元素，但需要熟练掌握css选择器
css选择器
(1)类选择器--------.XXX选择class属性为xxx的元素
(2)id选择器-------- #XXX选择id属性为xxx的元素
(3)元素选择器-----XXX选择标签名为xxx的元素
(4)属性选择器-----[yyy='bbb']选择yyy属性取值为bbb的元素
(5)派生选择器-----AA>XX或AA XX选择AA标签下的XX元素
你可以通过获取xpath的方式来从页面获取css选择器
在css里标识层级关系使用的是>或者空格（xpath里使用的是/）
div#xx1>input.yy2

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
# 通过css选择器定位输入框,输入内容selenium
browser.find_element(By.CSS_SELECTOR, '#toolbar-search-input').send_keys('selenium')
# 停留三秒后关闭浏览器
time.sleep(3)
browser.quit()

几种元素定位方式区别

定位方式	定位是否唯一	返回值类型	备注
id属性定位	唯一	element	只有当标签有id属性时才能使用
name属性定位	可能不唯一	element或elements列表	只有当标签有name属性时才能使用
class属性定位	可能不唯一	element或elements列表	只有当标签有class属性时才能使用
tag属性定位	可能不唯一	element或elements列表	通常得到的都是一组列表
link_text精确定位	可能不唯一	element或elements列表	一般情况定位是唯一的，只有存在link_text相同时,才得到列表
link_text模糊定位	可能不唯一	element或elements列表	一般用于定位标签
link_text模糊定位	可能不唯一	element或elements列表	一般用于定位标签
xpath定位	可能不唯一	element或elements列表	一般用来做精确定位，用/表示元素层级关系，xpath属性定位值必须加引号
css选择器定位	可能不唯一	element或elements列表	一般用作精确定位，用>或空格表示元素层级关系,属性值可以不加引号

文本输入、清除与提交

send_keys('XXX')文本输入
clear()文本清空

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
# 通过css选择器定位输入框
input_text = browser.find_element(By.CSS_SELECTOR,'#toolbar-search-input')
# 输入文本
input_text.send_keys("selenium")
# 停留2秒
time.sleep(2)
# 清空文本
input_text.clear()
# 停留三秒后关闭浏览器
time.sleep(3)
browser.quit()

submit()提交

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.bing.com")
# 通过xpath选择器定位输入框,并输入CSDN
input_text = browser.find_element(By.XPATH,'//*[@id="sb_form_q"]').send_keys("CSDN")
time.sleep(2)
# 定位提交按钮后提交
browser.find_element(By.XPATH,'//*[@id="sb_form_go"]').submit()
# 停留3秒后关闭
time.sleep(3)
browser.quit()

获取页面内容

title页面标题
page_source 页面源码
current_url页面连接
text标签内文本

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
# 获取标题
title = browser.title
# 输出
print(title)
# 获取源代码
source_code = browser.page_source
#输出源代码
print(source_code)
# 获取页面链接
url = browser.current_url
#输出页面链接
print(url)
# 获取标签内文本
text = browser.find_element(By.XPATH, '/html/body/div[1]/div/div/div/div[2]/div/div/button/span').text
print(text)
# 关闭页面
time.sleep(3)
browser.quit()

隐式等待

implicitly_wait(N)通过一定时长等待页面元素加载，最大等待时长N秒,如果中间某个时刻元素加载好了，就会结束等待，执行下一步操作；如果超出设置时间元素没加载出来，抛出没有这样的元素异常。

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
# 隐式等待
browser.implicitly_wait(5)
# 关闭页面
browser.quit()
time.sleep(3)

调整浏览器窗口尺寸

maximize_window()窗口最大化
minimize_window()窗口最小化
set_window_size(width,height)调整窗口到指定尺寸

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
# 窗口最大化
browser.maximize_window()
#停留2秒
time.sleep(2)
#窗口最小化
browser.minimize_window()
# 指定窗口尺寸
browser.set_window_size(300, 500)
# 关闭页面
time.sleep(3)
browser.quit()

前进一页后退一页

forward()前进一页
back()后退一页

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By

# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
browser.find_element(By.LINK_TEXT, 'Python').click()
#停留2秒
time.sleep(2)
# 页面后退一页
browser.back()
# 停留2秒
time.sleep(2)
# 前进一页
browser.forward()
# 关闭页面
time.sleep(3)
browser.quit()

页面刷新

refresh()页面刷新

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
browser.find_element(By.LINK_TEXT, 'Python').click()
#停留2秒
time.sleep(2)
# 页面刷新
browser.refresh()
# 关闭页面
time.sleep(3)
browser.quit()

###窗口切换

current_window_handle获取当前窗口的句柄
window_handles获取所有打开页面的句柄，是一个列表
switch_to.window(“XX”)切换到指定页面，XX代表页面句柄
switch_to.frame(XX)切换到内敛框架页面，XX代表内联框架标签的定位对象，演示请看章节2.10源码。
swith_to.parent_frame()切回到内敛框架的上一级，即从内敛框架切出。演示请看章节2.10源码。
switch_to.alert切换到页面弹窗，演示请看章节2.13源码。

from time import sleep
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("http://www.csdn.net")
sleep(2)
# 获取当前窗口句柄
page_context = browser.current_window_handle
# 打开其它页面
browser.find_element(By.XPATH, '//*[@id="toolbar-search-input"]').send_keys('selenium')
browser.find_element(By.XPATH, '/html/body/div[1]/div/div/div/div[2]/div/div/button/span').click()
sleep(2)
# 切换到刚开始打开页面
browser.switch_to.window(page_context)
# 获取当前打开所有页面的句柄
pages_context = browser.window_handles
# 输出当前打开页面个数
print(len(pages_context))  # 结果：2
# 关闭
sleep(3)
browser.quit()

frame/iframe内元素操作

由于找不到内敛框架的页面，这里我自己简单写了个页面。下边是HTML源码，操作时注意路径get()内url不要写错。

<!DOCTYPE html>
<html>
<head>
	<meta charset="utf-8">
	<meta name="viewport" content="width=device-width, initial-scale=1">
	<title>frame内敛框架页面</title>
</head>
<body>
	这是框架frame外:<input type="text" >
	<iframe id='frame' src="http://www.csdn.net" width=1000px height=500px></iframe>
</body>
</html>

获取标签元素的属性值（复选框）

get_attribute("XX")获取标签属性值,XX为标签属性名。
这里我们通过获取标签元素的属性值，对标签进行操作。以下示例为通过获取复选框标签的属性值对复选框进行选取。

<!DOCTYPE html>
<html>
<head>
	<meta charset="utf-8">
	<meta name="viewport" content="width=device-width, initial-scale=1">
	<title></title>
</head>
<body>
	用户名：<input type="text" name="user_name">
	密码：<input type="password" name="pwd">
	<input type="checkbox" name="Java">Java
	<input type="checkbox" name="Python">Python
	<input type="checkbox" name="C++">C++
	<input type="checkbox" name="JavaScript">JavaScript
	<input type="checkbox" name="HTML">HTML
</body>
</html>

Python源码

import time
# 导入selenium包
from selenium import webdriver
from selenium.webdriver.common.by import By
# 启动并打开指定页面
browser = webdriver.Firefox()
browser.get("file:///C:/Users/admin/Desktop/checkbox.html")
# 定位input标签
tag_input = browser.find_elements(By.TAG_NAME, 'input')
# 通过type属性的值来定位元素,并进行选取
for type_value in tag_input:
    # 输出input标签的name属性的值：
    print(type_value.get_attribute("name"))
    # 对复选框进行选取操作
    if type_value.get_attribute("type") == "checkbox":
        type_value.click()
        time.sleep(2)
# 关闭浏览器
time.sleep(3)
browser.quit()

控制台输出结果：

user_name
pwd
Java
Python
C++
JavaScript
HTML

下拉列表操作

Select("XX)判断标签元素XX是否为下拉列表元素，是返回Select对象，不是报错
select_by_value("XX")通过下拉列表value属性的值XX选择选项
select_by_visible_text("XX")通过下拉列表文本内容XX选择选项
select_by_index(N)或options[N].click()通过下拉列表索引号N选则选项，从0 开始
options下拉列表内options标签

目录CONTENT

Python自动化库 Selenium使用