标签:Python与Excel,库工具
最近,在学习将PDF文件中的数据表转换到Excel中时,安装所需要的库后,不能正常运行。后来,经过一番折腾,终于解决!特将此过程记录下来,供遇到类似问题时参考。
在使用Python读取PDF文件中的数据表时,需要安装tabula-py库,而安装这个库之前,需要先安装Java。
在这里:
https://java.com/en/download/help/download_options.xml
可以找到并下载Java安装文件。
安装好Java后,在命令行使用:
pip install tabula-py
安装了tabula-py库。
一切顺利。
然而,在使用其读取PDF文件中的表时,出现下面的错误。
图1
究其原因,是由于我使用默认安装,Java文件夹不在PATH系统变量中。要解决此问题,只需将Java安装文件夹添加到PATH变量。
我找到我电脑上Java文件夹是C:\Program Files\Java\jre1.8.0_311\bin。
现在开始添加。
打开Windows控制面板,在其中搜索“环境变量”,如下图2所示。
图2
单击“编辑系统环境变量”,打开“系统属性”对话框,单击该对话框“高级”选项卡中的“环境变量”按钮,打开“环境变量”对话框,如下图3所示。
图3
选择“Path”,单击“编辑”按钮。
在“编辑环境变量”对话框中,单击“新建”按钮,添加:
C:\Program Files\Java\jre1.8.0_311\bin
结果如下图4所示。
图4
单击“确定”按钮。
至此,完成设置。
然而,当我接着运行Python代码时,错误仍然存在。
于是,我关闭了浏览器,重新启动,再次输入并运行代码,正常。