假如我想把一个有图片又有文字的wPS文档存入mongo,怎么办

假如我想把一个有图片又有文字的wPS文档存入mongo,怎么办

例如我们的作业批复文档,有图片也有汉字,想要存入mongo,怎么做,我试了一下,GKB和utf-8,都读不出来,rb倒是可以读出来

正在回答 回答被采纳积分+1

登陆购买课程后可参与讨论,去登陆

2回答
好帮手慕美 2019-06-04 16:01:54

同学,你好,Python可以利用python-docx模块处理word文档,使用pip install python-docx(只能读取.docx文件,不能读取.doc文件)。同学可以作为了解。

参考代码:

from win32com import client as wc
import docx

# 首先将doc转换成docx
word = wc.Dispatch("Word.Application")
doc = word.Documents.Open(r"E:\python练习\文档.doc")  # 路径要写完整
#使用参数16表示将doc转换成docx
doc.SaveAs(r"E:\python练习\文档.docx",16)
doc.Close()
word.Quit()

# 读取文档内容
# Document对象,表示一个word文档。
file = docx.Document("E:\\python练习\\文档.docx")
print("段落数:" + str(len(file.paragraphs)))
# 输出每一段的内容
# Paragraph对象的text属性,表示段落中的文本内容
for para in file.paragraphs:
    print(para.text)


好帮手慕美 2019-06-04 10:59:30

同学,你好。GBK和utf-8只可以读取相对应编码格式的文档,当读取二进制文件时如图片或视频,要以'rb'二进制的形式打开并读取文件内容。rb既可以读取文字也可以读取图片。

如果我的回答解决了您的疑惑,请采纳!祝学习愉快~~~~

  • 提问者 kkkkke #1
    如果要读取doc文件内容呢
    2019-06-04 14:32:48
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师