报错的问题

老师，我一开始写的value = value_search.findall(response.url)[0]，报错，然后下载了资料里的代码改的

try:
value = value_search.findall(response.url)[0]
except:
print('11111111111', response.url)

打印出来的url我看了也挺正常的呀，怎么会报错呢

xiaoyuan1 2020-03-28

源自：实战：抓取二手车网站汽车数据 4-1 推送爬虫项目至服务器

收起

3回答

时间，回答被采纳获得+3积分 2020-03-30 14:20:56

同学，你好。该问题是下标越界的错误，根据下标0取值时取不到，因此会报错。同学可以只打印出根据下标取值前得到的数据，看下取到的数据是否正常，而且最后一页内容是没有下一页的。

如果我的回答解决了您的疑惑，请采纳！祝学习愉快~~~~

收起回答

xiaoyuan1 提问者 #1

回复里面没法截图，我在上面直接回答了

2020-04-05 17:25:30

提问者 xiaoyuan1 2020-04-14 11:02:55

老师，您看这样行不，没有下一页了，就直接pass掉了，可以吗

收起回答

时间， #1

同学，你好。使用pass是可以的，祝学习愉快~~~~

2020-04-14 16:06:09

提问者 xiaoyuan1 2020-04-05 17:25:00

老师，我知道这个报错是什么意思，但是我不知道咋改。

您说的最后一页是没有下一页的，是呀，咱们在最开始的if语句中不是已经判断了吗？

图中标的1那，如果只写value = value_search.findall(response.url)[0]会报那个下标越界的错误

图中标的2那，如果按2那么写，如果报错了那么下面response.request.meta['task_url'] = 'https://www.guazi.com/%s/%s/o%si7' % (value[0], value[1], str(int(value[2]+1)))这里就取不到value值了

收起回答

慕之熠_灿烈 #1

最后一页的判断逻辑已经在if语句中进行了判断，该代码逻辑是用来实现对下一页数据的抓取，那么当无法取值时，说明已经取到所有的页面，此外按照图中标2的方式实现可采用try ··except··finally的结构进行尝试。（注意：该代码逻辑必须处于与上面的for循环同一个代码层次）。

2020-04-07 14:00:52
提问者 xiaoyuan1 回复慕之熠_灿烈 #2

老师，这段代码是和上面的for循环是处于同一个代码层次的。老师您说的可采用try ··except··finally的结构实现，finally不管上面怎么样都会执行下面的代码，如果没有下一页，那么value = value_search.findall(response.url)[0]没有值，finally最后都执行的代码，写什么呢

2020-04-13 20:35:19
时间，回复提问者 xiaoyuan1 #3

同学，你好。同学可以将response和yield语句放在finally语句中，或者直接使用try……except……就可以。祝学习愉快~~~~

2020-04-14 09:53:54