scrapy爬取数据不完整

scrapy爬取数据不完整

如题,使用scrapy爬取百度新闻URL时,相同的xpath语句,爬取的数据却大量缩水。在浏览器使用xpath语句时,显示300多条数据,但是使用scrapy却只能爬到60多条数据。急求解决方案。

http://img1.sycdn.imooc.com//climg/5eb5213f09cd484010380274.jpg

http://img1.sycdn.imooc.com//climg/5eb5213f094b0ee425300232.jpg

http://img1.sycdn.imooc.com//climg/5eb5213f09b750b618540748.jpg


正在回答

登陆购买课程后可参与讨论,去登陆

1回答

同学,你好。可能是由于请求对方服务器的的速度太快,就会导致服务器无数据返回,查看控制台可以看到虽然请求参数是200,但数据为空。建议同学设置爬虫的请求速度和下载速度,如可以通过time.sleep控制程序请求的速度。

如果解决了你的疑惑,请采纳,祝学习愉快~ 

  • 慕粉2259528397 提问者 #1
    请问sleep函数应该具体写在哪里呢
    2020-05-08 20:42:26
  • 好帮手慕笑蓉 回复 提问者 慕粉2259528397 #2
    同学,你好。可将sleep内容写到每次向网页发起请求数据前,以控制每次请求数据的请求间隔时间。 祝学习愉快~
    2020-05-09 14:17:59
  • 慕粉2259528397 提问者 回复 好帮手慕笑蓉 #3
    我的程序里面对第一页数据只请求一次(news = response那一行),sleep就不知道往哪里写,写在请求前面吗,还是后面?
    2020-05-09 17:18:43
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
4.入门主流框架Scrapy与爬虫项目实战
  • 参与学习           人
  • 提交作业       107    份
  • 解答问题       1672    个

Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。

了解课程
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师