数据抓取不全的问题

数据抓取不全的问题

老师好,我在抓取数据存入数据库时,发现数据库中的数据总数没有网站上的多,

请问:导致数据抓取不全的原因有哪些?(大概丢失了800多条数据)

正在回答 回答被采纳积分+1

登陆购买课程后可参与讨论,去登陆

1回答
好帮手慕美 2020-03-30 18:35:57

同学,你好。同学可以看下在爬取数据时得到的数据是否是完整的。scrapy是异步的,一旦请求速度和下载页面速度过快,就会导致服务器无数据返回,会造成数据遗漏的情况。

如果我的回答解决了您的疑惑,请采纳!祝学习愉快~~~~

  • 提问者 程序蛙 #1
    1.怎么查看爬取数据时得到的数据是否是完整的? 2.若不完整,怎么解决?
    2020-03-31 11:36:11
  • 好帮手慕美 回复 提问者 程序蛙 #2
    同学,你好。 1、同学可以看下在获取项目url及在控制台打印的内容是否与网站上是相同的 2、同学可以不断的请求,然后对数据进行去重,才能保证数据的唯一性。课程中没有涉及到去重的内容,同学可以查阅相关文档进行学习。 祝学习愉快~~~~
    2020-03-31 16:25:11
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
4.入门主流框架Scrapy与爬虫项目实战
  • 参与学习           人
  • 提交作业       107    份
  • 解答问题       1672    个

Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。

了解课程
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师