BeautifulSoup 爬虫小实列

发布于 2021-03-19  177 次阅读


获取邮箱里的链接

操作步骤

首先必须要导入 bs4 库

from bs4 import BeautifulSoup

创建 beautifulsoup 对象 并且设置内容,和解析器

soup = BeautifulSoup(data.text, 'lxml')

根据子标签查找对应的内容,在获取标签的内容 (select返回内容为list类型).string获取标签内的内容

text = soup.select("#main > div > div > div.col-sm-10.content > div.table-responsive.msglist > div > div.mail-content > a")[0].string

子标签获取


侠之大者,为国为民,侠之小者,为友为邻