python3如何获取a标签href属性值
编辑:Simone
2025-04-05 11:57:23
514 阅读
获取标签常用正则匹配,还有就是直接利用第三方类库BeautifulSoup
原理都是一样的
正则匹配是我们需要学的基础
BeautifulSoup类库使用方便快捷,很好入门
先介绍第一种,通过正则匹配a标签下面的href属性
先写一个标准的html,如下图:
先用正则匹配的方式来识别
使用正则首先需要导入相关的包
importre
然后创建正则表达式
pattern='
用re.search可以查找到第一个
用re.findall可以查找到所有的
还可以使用BeautifulSoup直接方便的省略掉正则表达式
用类库,需要自己先安装
安装之后导入即可
from bs4 import BeautifulSoup初始化soup = BeautifulSoup(html, 'html.parser')
可以查找到所缝胆有的a标签
soup.find_all('a')
找到所攀涛有的a标签,然铲蹲随后我们在从a标签中查找到href的值就可以了
使用for循环找出所有的a标签,href的值
版权声明:本站【趣百科】文章素材来源于网络或者用户投稿,未经许可不得用于商用,如转载保留本文链接:https://www.qubaik.com/life/170446.html