老师，首页地址爬取的时候，怎么获新闻的详情的连接地址，

爬取以下地址，怎么获取到详情的地址？例如https://www.dongqiudi.com/news/1370496.html

不知道咋处理？请老师指导一下

https://www.dongqiudi.com/newsList/3，

https://www.dongqiudi.com/newsList/4，

https://www.dongqiudi.com/newsList/5，

https://www.dongqiudi.com/newsList/6

慕婉清5162727 2020-03-25

源自：实战：抓取二手车网站汽车数据 6-2 项目作业

24

收起

2回答

时间，回答被采纳获得+3积分 2020-03-27 09:56:13

同学，你好。我们获得到的json文件的路径就是我们的请求路径。点击加载更多，会有json请求的文件。然后拼接json的请求路径即可。

如该请求https://dongqiudi.com/api/app/tabs/web/56.json?after=1572577395&page=1

其中56为栏目编号，after为时间戳，page为页码。栏目的编号都有：56,232,57,3,4,5,6。然后自己去拼接请求即可。

如果我解决了同学的问题，请采纳！学习愉快~~~~

时间， 2020-03-26 10:18:10

同学，你好。不确定同学该作业中的其他位置的代码，同学可以参考下述方法得到详情页的url。

如果我的回答解决了您的疑惑，请采纳！祝学习愉快~~~~

提问者慕婉清5162727 #1

设定实例方法handle_page_response（self,response），在本方法中解析首页请求的返回，传递新闻URL，新闻标题，新闻发表时间到handle_detail方法。----老师我想问的是这里的传递新闻url中的url怎么取？页面张找不到，json也只有第二页之后才有，首页都是乱码，取不出来，谢谢老师

2020-03-26 20:26:40

相似问题

xshell连接出现此问题

老师，像这种没有把详情页的url放在html文本里的我应该怎么获取啊

怎么没有ip地址

图片地址json输出

老师 3-3作业详情页面轮播图数据在什么地方获取？

登录后可查看更多问答，登录/注册

4.入门主流框架Scrapy与爬虫项目实战

参与学习人
提交作业 107 份
解答问题 1672 个

Python最广为人知的应用就是爬虫了，有趣且酷的爬虫技能并没有那么遥远，本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。

本课精华内容

问答作业

shell脚本老是报错

45 8

没有办法取到全部城市数据，要怎么操作呢

40 3

获取全部城市的问题

111 3

那个思科的下载不了啊。。。

30 1

数据爬取问题

44 19

查看更多本课问答

请稍等 ...

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号