老师,首页地址爬取的时候,怎么获新闻的详情的连接地址,

老师,首页地址爬取的时候,怎么获新闻的详情的连接地址,

正在回答

登陆购买课程后可参与讨论,去登陆

2回答

同学,你好。我们获得到的json文件的路径就是我们的请求路径。点击加载更多,会有json请求的文件。然后拼接json的请求路径即可。

http://img1.sycdn.imooc.com//climg/5e7d5d1d09a9588a08130198.jpghttp://img1.sycdn.imooc.com//climg/5e7d5d29094955a308820245.jpg

如该请求https://dongqiudi.com/api/app/tabs/web/56.json?after=1572577395&page=1

其中56为栏目编号,after为时间戳,page为页码。栏目的编号都有:56,232,57,3,4,5,6。然后自己去拼接请求即可。

http://img1.sycdn.imooc.com//climg/5e7d5c99092f0aba09620178.jpg

如果我解决了同学的问题,请采纳!学习愉快~~~~

好帮手慕美 2020-03-26 10:18:10

同学,你好。不确定同学该作业中的其他位置的代码,同学可以参考下述方法得到详情页的url。

http://img1.sycdn.imooc.com//climg/5e7c109109f26e8311600275.jpg

http://img1.sycdn.imooc.com//climg/5e7c10ad09104b9106920173.jpg

如果我的回答解决了您的疑惑,请采纳!祝学习愉快~~~~

  • 提问者 慕婉清5162727 #1
    设定实例方法handle_page_response(self,response),在本方法中解析首页请求的返回,传递新闻URL,新闻标题,新闻发表时间到handle_detail方法。----老师我想问的是这里的传递新闻url中 的url怎么取?页面张找不到,json也只有第二页之后才有,首页都是乱码,取不出来,谢谢老师
    2020-03-26 20:26:40
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
4.入门主流框架Scrapy与爬虫项目实战
  • 参与学习           人
  • 提交作业       107    份
  • 解答问题       1672    个

Python最广为人知的应用就是爬虫了,有趣且酷的爬虫技能并没有那么遥远,本阶段带你学会利用主流Scrapy框架完成爬取招聘网站和二手车网站的项目实战。

了解课程
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师