正在回答 回答被采纳积分+1
1回答
时间,
2020-04-13 18:12:11
同学,你好。
1、Accept-Encoding用于声明浏览器支持的编码类型,表示发送请求时告诉服务器可以解压这些格式的数据。
2、如果带有accept-encoding,则返回的内容是经过压缩的,如果以为获得的是源代码本身然后去解码、处理,就会报错。所以这种情况下,拿到的是压缩数据,可以使用python库进行解压,然后再解码、解析网页。另一种方法是请求时将headers中的accept-encoding字段去除掉,即告诉网页我不支持压缩数据,网页就会把源代码本身的数据传送给你。
3、在请求时是否添加Accept-Encoding,可以根据实际情况来选择
如果我的回答解决了您的疑惑,请采纳!祝学习愉快~~~~
4.入门主流框架Scrapy与爬虫项目实战
- 参与学习 人
- 提交作业 107 份
- 解答问题 1672 个
Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。
了解课程


恭喜解决一个难题,获得1积分~
来为老师/同学的回答评分吧
0 星