获取不到页面信息

获取不到页面信息

http://img1.sycdn.imooc.com//climg/5d395cbf00017ac917870829.jpg

返回的只有一个<html></html> 但是上面的页面url是可以正常打开的

正在回答 回答被采纳积分+1

登陆购买课程后可参与讨论,去登陆

3回答
卡拉啵啵 2019-10-29 15:12:26

打开网址看一下,可能哪个地区没有相应的汽车信息,或者你可以给url一个定值,不从mongodb里面去取数据。

老中医学编程 2019-10-11 01:19:52
request.headers['User-Agent']= "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36"

在middleware中设置user-agent

  • 我也也是碰到这个问题了,也没报错,原来是没有加这个。
    2019-12-05 15:06:57
提问者 Pinocchio_J 2019-07-25 15:51:14

解决了....原因是之前没带user-agent信息

可能是被网站屏蔽了- -


  • 我想问下你,user-agent是设置到downloader_middleware中间件里面吗?
    2019-08-24 11:33:41
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
4.入门主流框架Scrapy与爬虫项目实战
  • 参与学习           人
  • 提交作业       107    份
  • 解答问题       1672    个

Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。

了解课程
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师