为什么只能爬取9页数据

为什么只能爬取9页数据

一页数据大概50页,数据库中有450条,就 不能爬取了



正在回答 回答被采纳积分+1

登陆购买课程后可参与讨论,去登陆

1回答
慕之熠_灿烈 2020-02-14 16:18:33

同学,你好。

造成上述问题可能的原因如下:

(1)ip有效性被服务器甄别出来,造成及时性的数据丢失;

(2)可按页进行抓取,定位到哪一页到数据不可以正常抓取,然后分析其页面构成与之前页面是否一致或分析其目标url的链接中参数的与之前页面是否相同;

如果我的回答解决了您的疑惑,请采纳!祝~学习愉快~

  • 提问者 mfloat流风 #1
    添加了代理
    2020-02-14 17:00:14
  • 慕之熠_灿烈 回复 提问者 mfloat流风 #2
    建议同学,按照(2)中所描述的方式先进行下测试,查看到底是哪一页数据未抓取成功,然后针对这一页的数据单独进行抓取,观看其是否成功下载对应的数据。
    2020-02-14 18:10:42
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
4.入门主流框架Scrapy与爬虫项目实战
  • 参与学习           人
  • 提交作业       107    份
  • 解答问题       1672    个

Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。

了解课程
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师