如果是JS动态渲染的页面，爬虫该怎么解决

问题描述：

纵横中文网更新之后，跟视频里面呈现的不太一样。

我抓了一下这个位置的div。没有抓到。

相关截图：

相关代码：

import requests
from lxml import etree

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}

def parse(url):
    res = requests.get(url, headers=headers)
    tree = etree.HTML(res.text)
    # print(res.text)
    items = tree.xpath('//div[@class="book--hover-box"]')
    print(items)

parse('https://www.zongheng.com/rank?nav=one-day&rankType=3')

print出来的是一个空数组。

于是我把网页存下来，然后查了一下是否存在这个DOM元素。没有找到

相关代码：

with open('./docs/index.html', "w", encoding="utf-8") as f:
    f.write(res.text)

相关截图：

我拿书名去查了一下，发现是写在JS脚本里的。

相关截图：

问题描述：

学的不深入，不知道遇到这种情况该怎么解决。

如果只是想获取书名以及书籍ID，直接看JS代码就可以了。但如果是这样，就不算是爬虫了。
所以请教一下老师，如果还是想以爬虫的方法，来扒取这个页面上的书名以及书籍详情页链接，该如何实现。

夜魇丶 2024-01-22

源自：Python 全流程数据爬取 4-12 【实战】纵横中文网：爬取小说详情页

收起

1回答

夜魇丶提问者 2024-01-23 17:41:23

【PC端没找到删除问题的位置…】

看了后面豆瓣的课程，解决该问题了。

收起回答

好帮手慕小猿 #1

同学，你好！同学自己解决了问题棒棒哒~
祝学习愉快~

2024-01-23 20:36:34

相似问题

老师请问浏览器渲染页面过程这一块知识点在那里讲到过

为什么就这么简单的数据还要单独用js渲染？

动态渲染出来的数据是没有html的吗

关于页面渲染

spa前端渲染项目，fp fcp这些统计还有意义不？

登录后可查看更多问答，登录/注册

Python全能工程师

参与学习 1607 人
提交作业 2899 份
解答问题 1002 个

8阶段5大热门领域，从入门到实战，带你从零基础晋级全能，全面提升就业力

了解课程

本课精华内容

问答作业

慕慕生鲜网站及其接口在线文档无法访问

54 3

不知道为什么出错了

27 10

老师，为什么会一直显示握手失败啊，而且代码也没有运行下去

23 10

课程中老师讲的这个代码是什么意思啊，并不是很明白

16 9

当浏览器的宽度小于966px的时候，发表的框框就换行了，

21 9

查看更多本课问答

请稍等 ...

如果是JS动态渲染的页面，爬虫该怎么解决

如果是JS动态渲染的页面，爬虫该怎么解决

正在回答回答被采纳积分+1

请选择置顶位置