老师,还有就是为什么添加了下载中间键后就必须同时添加user_agent呢?

老师,还有就是为什么添加了下载中间键后就必须同时添加user_agent呢?

在没有添加下载中间键时,scrapy可以返回203的响应;添加下载中间键后需要还需要添加user_agent否则五法获取数据

http://img1.sycdn.imooc.com//climg/5dda83c7099436ae05000232.jpg

正在回答 回答被采纳积分+1

登陆购买课程后可参与讨论,去登陆

1回答
好帮手乔木 2019-11-25 13:53:40

同学你好:

1 下载中间键的作用就是防反爬虫机制的设置,在发起request请求前设置防止反爬虫机制。自定义下载中间键,在中间键中定义process_request()方法,那么所有的request请求都会执行process_request()方法,所以在该方法中设置user-agent是可行的。关于scrapy中间键的具体使用同学可以去参考官方的文档。

https://oner-wv.gitbooks.io/scrapy_zh/content/

2 如果不在中间键中设置user-agent,在settings文件中同样可设置了user-agent这个配置。两者选一个使用即可。

http://img1.sycdn.imooc.com//climg/5ddb6a7c094017b112320072.jpg

如果我解决了同学的问题,请采纳!学习愉快^_^。



问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
4.入门主流框架Scrapy与爬虫项目实战
  • 参与学习           人
  • 提交作业       107    份
  • 解答问题       1672    个

Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。

了解课程
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师