跪求大神指点

课外提问，求大神指点

题目：利用Feapder框架，爬取http://www.cae.cn/cae/html/main/col48/column_48_1.html

工程院院士的信息

代码：

# -*- coding: utf-8 -*-

"""

Created on 2021-12-03 20:30:27

---------

@summary:

---------

@author: DELL

"""

import feapder

import time

Name = []

list_all = [] # 创建空列表，用于下面存储数据

urls = []

target2 = 'https://www.cae.cn'

def write(name, text):

text_name = '文本1.txt'

with open (text_name, 'a+', encoding='utf-8') as m:

m.write(name +'\n')

m.writelines(text.replace('&ensp', ' ').replace(';','').lstrip())

m.write('\n\n')

class TargetSpider(feapder.AirSpider):

def start_requests(self): # 生产任务

url = 'http://www.cae.cn/cae/html/main/col48/column_48_1.html'

headers = {

'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'

}

yield feapder.Request(url, headers=headers, render = True)

def parse(self, request, response): # 解释

card_elements = response.xpath('li',class_ = 'name_list')

for i in card_elements:

Continue_card = i.xpath('a')

global Name

Name.append(Continue_card[0].string) # 获取每个链接的名字

global list_all

for j in Continue_card:

temp1 = j.xpath('href').extract_first()

list_all.append(temp1)

for k in list_all:

temp2 = k.xpath('div', class_ = 'intro')

temp3 = temp2.xpath('p')

write(Name[k],temp3)

if __name__ == "__main__":

TargetSpider().start()

下面是HTML的格式：

代码图片：

问题：编写的代码爬取的时候一直报错

求大神指点

渊鱼sky 2021-12-09

源自：Python字符串常用方法 1-1 本周学习安排

收起

1回答

好帮手慕凡 2021-12-09 16:54:37

同学，你好！

同学可以往后学一下使用课程中的爬虫模块进行爬取，祝学习愉快~

收起回答

提问者渊鱼sky #1

老师好，用Feapder爬取文本（必须用Feapder框架），写到.txt文件中还是报错，请老师指点
下面是网页HTML代码

2021-12-09 19:55:00
好帮手慕凡回复提问者渊鱼sky #2

同学，你好！
老师对Feapder框架并不是很了解，抱歉解决不了同学的问题，同学可以提问课程中相关的问题，祝学习愉快~

2021-12-10 09:43:34