老师我把page写的好大，还是能获取到数据

import scrapy


class AppSpider(scrapy.Spider):
    name = "app"
    allowed_domains = ["search.jd.com"]
    start_urls = ["https://list.jd.com/list.html?cat=1123713%2C3258&page=90907865&s=68971&click=0"]

    def parse(self, response):
        lis = response.xpath('//*[@id="J_goodsList"]/ul/li')
        nac = response.xpath('//*[@id="J_bottomPage"]/span[1]/a/em/text()')
        bq = response.xpath('//*[@id="J_goodsList"]/ul/li[38]/div/div[6]/a/text()')
        print(lis)
        # for i in lis:
        #     title = i.xpath('.//div/div[3]/a/em/text()').get()
        #     price = i.xpath('.//div/div[2]/strong/i/text()').get()
        #     print(title, price)

吴老师在线叛逃 2023-07-19

源自：Scrapy 高级爬虫框架与分布式爬虫 2-9 【实战】京东商城：分布式爬虫（一）

收起

1回答

好帮手慕小猿 2023-07-20 10:43:47

同学，你好！同学想爬取哪的数据，爬取的是哪个页面的url ,可以截图方便老师查看。同学若是想获取下一页的数据，同学可多点击几页数据，看每页之间的数据变化，找下规律。

祝学习愉快~

收起回答

提问者吴老师在线叛逃 #1

视频里老师把page的值写到上千之后就无法获取数据了，为什么我还是可以获取数据啊

2023-07-20 11:28:33
好帮手慕小猿回复提问者吴老师在线叛逃 #2

同学，你好！网站进行了迭代，已经改版了。最大数显示的是最后一页，第100页的内容
同学可对爬取页数进行下判断，若是page<=100，则获取我们想要的数据

祝学习愉快~

2023-07-20 12:05:26