【项目作业】Scrapy框架Scrapy架构爬虫实战
项目作业 180
等2人参与

亲爱的同学们,学练结合才能更好的掌握知识,接下来请使用 Scrapy 框架完成下面的作业吧!

作业描述

为了更加高效的进行数据抓取,请大家运用 Scrapy 框架,对目标站点 article.spbeen.com 进行爬取,获取至少5篇文章的内容,并将这些内容保存到本地的文本文件中。

抓取内容包含:标题、正文和发布日期

目标站点 url: article.spbeen.com

请注意,爬取网站内容前,务必检查网站的robots.txt文件,以确保遵守网站的使用条款。同时,不要对目标网站造成过大的访问压力,合理设置爬取速度和延迟。

评分标准是什么?

一、规范【10分】
1、类的定义、类的成员变量命名规范
2、代码结构要层次分明
3、Python 代码规范及添加适量注释

二、程序整体运行效果【20分】
实现数据的抓取和存储

三、爬虫项目分析与实现【50分】
四、数据成功写入到本地文件a.txt中【20分】

项目作业上传说明
第1步:上传你的作业压缩包
第2步:等待讲师一对一批复
第3步:查看讲师点评
上传作业

登录后查看更多作业,立即

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师