爬取城市信息的问题

爬取城市信息的问题

1.老师,我看了你给其他同学写的获取城市代码,红框中的xpath语句为什么要提取script的数据,那一段正则的意义是什么,好像没改变什么

2.为什么不通过div的获取方式获取数据

http://img1.sycdn.imooc.com//climg/5eca1bef09de3c4f19191039.jpg

http://img1.sycdn.imooc.com//climg/5eca1d4209c90e2619201030.jpg


正在回答 回答被采纳积分+1

登陆购买课程后可参与讨论,去登陆

3回答
好帮手慕笑蓉 2020-05-24 16:45:47

同学,你好。

  1.  提取script数据是为了得到城市信息,正则是为了匹配script数据里的城市信息列表,如图:

    http://img1.sycdn.imooc.com//climg/5eca333a09f6c4f912980163.jpg

  2. 如果能够实现用div的方式获取数据也是可以的,这个没有统一的标准,这里用scripts更加快捷方便。

  3. 65-90是大写字母A-Z的ASCII码,用于匹配得到的城市信息首字母;

如果解决了你的疑惑,请采纳,祝学习愉快~

提问者 多敲多学多想 2020-05-24 15:47:54

这里为什么可以直接转换成城市的文字信息

http://img1.sycdn.imooc.com//climg/5eca267a099cc30c19201040.jpg

  • 提问者 多敲多学多想 #1
    cityOne = json.loads(city[1]) print(cityOne) cityTwo = json.loads(city[1]) 是这里处理的
    2020-05-24 16:02:02
提问者 多敲多学多想 2020-05-24 15:15:02

还有这些数值是根据什么判断出来的

http://img1.sycdn.imooc.com//climg/5eca1ed609dd46b908700648.jpg

问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
4.入门主流框架Scrapy与爬虫项目实战
  • 参与学习           人
  • 提交作业       107    份
  • 解答问题       1672    个

Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。

了解课程
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师