在Python中将ppt文件转换为pptx [英] Convert ppt file to pptx in Python

查看:39
本文介绍了在Python中将ppt文件转换为pptx的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

是否有办法将.ppt文件转换为.pptx文件。

目标:我需要从.ppt文件中提取表格中的文本(列名为姓名、地址、联系电话、电子邮件等)。为此,我遵循以下方法:

我将.ppt文件转换为pdf,然后使用PDFminer从pdf提取数据。从pdf中提取的文本不用任何分隔符分隔。因此,很难区分表中的名称和其他字段。

我正在研究的可能解决方案:

  1. 将.ppt文件转换为.pptx
  2. 解析.pptx文件的XML以获取格式化文本

我在将文件格式从.ppt转换为.pptx的第一步就卡住了。 我找不到在Python中将.ppt文件格式转换为.pptx格式的任何解决方案。

推荐答案

我已经创建了此代码,希望它能为您工作:

    import win32com.client
    PptApp = win32com.client.Dispatch("Powerpoint.Application")
    PptApp.Visible = True
    PPtPresentation = PptApp.Presentations.Open(r'D:pptsample.ppt')
    PPtPresentation.SaveAs(r'D:pptfinal.pptx', 24)
    PPtPresentation.close()
    PptApp.Quit()

这篇关于在Python中将ppt文件转换为pptx的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆