什么是BeautifulSoup

Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.

它能够通过使用你喜欢的转换器,实现文档导航,查找,修改等操作.

安装 BeautifulSoup

pip install beautifulsoup4

安装解析器

pip install lxml

使用BeautifulSoup

from bs4 import BeautifulSoup
soup = BeautifulSoup("<html>data</html>")