国产成人AV无码一二三区,少女1到100集,国产精品久久久久精品综合紧,巜公妇之诱感肉欲HD在线播放

文章 > Python常见问题 > pdf如何用python读取?

pdf如何用python读取?

头像

yang

2020-05-28 16:00:373855浏览 · 0收藏 · 0评论

python中可以使用pdfminer库来读取PDF文件中的内容。

安装命令:

pip install pdfminer
pip install pdfminer3k

python中读取PDF文件代码:

from urllib.request import urlopen
from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from io import StringIO
from io import open

def readPDF(pdfFile):
    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    laparams = LAParams()
    device = TextConverter(rsrcmgr, retstr, laparams=laparams)

    process_pdf(rsrcmgr, device, pdfFile)
    device.close()

    content = retstr.getvalue()
    retstr.close()
    return content

pdfFile = urlopen("http://pythonscraping.com/pages/warandpeace/chapter1.pdf")
outputString = readPDF(pdfFile)
print(outputString)
pdfFile.close()

解析pdf文件用到的类:

PDFParser:从一个文件中获取数据

PDFDocument:保存获取的数据,和PDFParser是相互关联的

PDFPageInterpreter处理页面内容

PDFDevice将其翻译成你需要的格式

PDFResourceManager用于存储共享资源,如字体或图像。

更多Python知识请关注Python自学网

关注

关注公众号,随时随地在线学习

本教程部分素材来源于网络,版权问题联系站长!

年轻的姐妹2| 老公在怀里吃奶像个小孩子| 敌伦交换小敏小静小雅第1集| 樱花电影大全免费观看西瓜| 《疯狂72小时》韩剧| 雨后小故事漫画| 77777影院在线观看电视剧大..| 《办公室高潮秘书2》电影| 妈妈俱乐部1-34节小说| 人野兽马狗猪大全| 电子课本网| 免费看网站在线观看人数在哪直播 | 女朋友想放进去睡是什么心理| 丫头把腿开大让我添添| 97在线观看免费高清电视剧大全.| 男女一起免费观看全集高清完整版.. | 17.C1起草视频| 《高潮3》HD未删减减| 《初次深交流》韩剧| 胸吻| 《爆乳女警2》完整版| 小妇人在线观看免费版电视剧| 《互换人妻HD中字》| 欧美电影免费观看电视剧大全| 妈妈你真棒插曲最后接吻是谁| 两个人轮流上24小时的班| 小莹的性荡生活第15章| 《有夫之妇的秘书》演员表| 鹿鞭丸的功效和作用| 小妹妹爱大棒棒免费观看电视剧| 白色变态蕾丝超薄开档连身袜 | 蜜桃成熟 在线| 拔小萝卜免费观看全集电视剧| 新婚夜被强伦无删减版| 欧美大片PPT免费PPT| 老师和学生深入交流人生奥秘| 7777影院免费观看电视剧大全| 小妈爱上继子免费观看电视剧 | 停不了的爱温碧霞| 吻戏| 《炸裂吧!巨棒》免费阅读漫画