bs4和lxml的两种库的区别

bs4和lxml的两种库的区别

老师,前面我们已经学习了bs4这个库,可以通过这个库查找定位相关的节点及属性值,现在学习的lxml也可以完成相关的需求,这两个库仅仅是一个问题的两种解决方案吗,还是各有侧重点?

正在回答

登陆购买课程后可参与讨论,去登陆

1回答

同学,你好。bs4和lxml是非常流行的两个python模块,他们常被用来对抓取的网页进行解析,以便进一步抓取的进行。但两者也是有区别的。

BeautifulSoup是比较常用且使用简单的技术,由于在操作过程中,会将整个文档树进行加载然后进行查询匹配操作,使用过程中消耗资源较多。

lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高。

如果我的回答解决了您的疑惑,请采纳!祝学习愉快~~~~

问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
4.入门主流框架Scrapy与爬虫项目实战
  • 参与学习           人
  • 提交作业       107    份
  • 解答问题       1672    个

Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。

了解课程
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师