bs4和lxml的两种库的区别
老师,前面我们已经学习了bs4这个库,可以通过这个库查找定位相关的节点及属性值,现在学习的lxml也可以完成相关的需求,这两个库仅仅是一个问题的两种解决方案吗,还是各有侧重点?
27
收起
正在回答
1回答
同学,你好。bs4和lxml是非常流行的两个python模块,他们常被用来对抓取的网页进行解析,以便进一步抓取的进行。但两者也是有区别的。
BeautifulSoup是比较常用且使用简单的技术,由于在操作过程中,会将整个文档树进行加载然后进行查询匹配操作,使用过程中消耗资源较多。
lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高。
如果我的回答解决了您的疑惑,请采纳!祝学习愉快~~~~
4.入门主流框架Scrapy与爬虫项目实战
- 参与学习 人
- 提交作业 107 份
- 解答问题 1672 个
Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。
了解课程
恭喜解决一个难题,获得1积分~
来为老师/同学的回答评分吧
0 星