main()中文本处理线程代码 的 位置问题
修改前:
修改后:
老师您好,我把 文本处理线程开启 的代码调到 页码线程释放代码 之后运行,最终爬取到的结果会少很多,为什么呢?(我没用代理,修改前的代码 数据都能爬到)
18
收起
正在回答
1回答
同学,你好!老师这边测试了同学说的问题,爬取数据是正常的,可能原因是同一ip重复爬取数据,网站的反爬策略限制了数据的抓取,可等待一段时间之后再次尝试
祝:学习愉快!
4.入门主流框架Scrapy与爬虫项目实战
- 参与学习 人
- 提交作业 107 份
- 解答问题 1672 个
Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。
了解课程
恭喜解决一个难题,获得1积分~
来为老师/同学的回答评分吧
0 星