配置BeautifulSoup-创新互联
首先,安装Beautifulsoup
成都创新互联公司凭借专业的设计团队扎实的技术支持、优质高效的服务意识和丰厚的资源优势,提供专业的网站策划、成都网站建设、成都网站制作、网站优化、软件开发、网站改版等服务,在成都十年的网站建设设计经验,为成都1000多家中小型企业策划设计了网站。pip install beautifulsoup4
然后初始化对象
from bs4 import BeautifulSoup
file = BeautifulSoup(open("index.html")) #此处传入文件,红色部分为要传入的页面源码文件
string = BeautifulSoup("data") #此处红色部分传入一个字符串
可以通过 .标签名 向下深入, 如 : file.p.a.span
遍历:
html 文件有标签,字符串等组成,遍历时可以同级遍历,也可以跨级遍历。
同级遍历: .previous_sibling
.next_sibling
跨级遍历:
向父级遍历:
.parent
向子级遍历:
.contents #以列表形式遍历,通过一个列表将结果展示出来
.children #以生成器形式遍历,比较节省内存
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
网站题目:配置BeautifulSoup-创新互联
标题路径:http://scyanting.com/article/dpcihc.html