为啥获取到的page_source一样

import time

from selenium import webdriver
import re
import json

class Handle_webdriver(object):
def __init__(self):
self.driver = webdriver.Chrome()
self.driver.maximize_window()

def handle_job(self):
self.driver.get("https://search.51job.com/list/010000,000000,0000,00,9,99,%20,2,1.html")
input_keyword = 'golang'
self.driver.find_element_by_id('keywordInput').send_keys(input_keyword)
self.driver.find_element_by_class_name('p_but').click()

while True:
time.sleep(2)
self.handle_parse(self.driver.page_source)
self.driver.find_element_by_xpath("//li[@class='next']/a").click()

self.driver.quit()

def handle_parse(self, page_source):
re_job_search = re.compile(r'window.__SEARCH_RESULT__\s=\s(.*?)</script>')
job_data = re_job_search.search(page_source)

info_list = []
if job_data:
job_data_list = json.loads(job_data.group(1)).get("engine_search_result")
for job_item in job_data_list:
info = {}
info['job_name'] = job_item['job_name']
info['company_name'] = job_item['company_name']
info['company_address'] = job_item['workarea_text']
info['money'] = job_item['providesalary_text']
info['date'] = job_item['updatedate']
info_list.append(info)
print(info_list)

test_selenium = Handle_webdriver()
test_selenium.handle_job()

决殇 2020-09-14

源自：自动化爬虫 6-2 实战—selenium实现51job全站点岗位信息自动化抓取-2

收起

1回答

时间， 2020-09-14 17:49:13

同学，你好。51job网站进行了修改，在返回数据时返回到了js中，因此得不到对应的源码。该部分内容正在更新中，更新完成会通知同学的，请同学耐心等待。

祝学习愉快~~~~

收起回答

提问者决殇 #1

但是我这是从js中抓取的数据呀，我的问题是为啥page_source方法返回的页面不会随之变化呢？？

2020-09-15 18:35:00
时间，回复提问者决殇 #2

同学，你好。该网站在返回源码时进行了调整，导致获取不到对应关键字的页面，同学可等课程更新后再学习。祝学习愉快~~~~

2020-09-15 19:09:06