摘要:这篇文章介绍如何把发票内容提取出来保存到Excel中。
程序会把发票中的内容提取出来然后写入Excel中,一个示例的发票内容如下:
提取结果如下:
-
下载代码
git clone https://github.com/yooongchun/PDF_Invoice2Excel.git
-
安装依赖包:
python -m pip install -r requirements.txt # 或者 pip install -r requirements.txt
-
准备数据
准备好PDF文件,放置到一个目录下
-
运行程序
# 注意:这里data指你的pdf文件放置的文件夹, -p data也可以替换为--path=data python Invoice2Excel.py -p data
-
运行测试,可以通过以下命令运行测试
python Invoice2Excel.py
-
指定输出文件位置
# 注意:这里data.xlsx指你的pdf结果保存文件, -s data.xlsx也可以替换为--save=data.xlsx python Invoice2Excel.py -s data.xlsx # 也可以同时指定两个参数 python Invoice2Excel.py -s data.xlsx -path=data
联系作者获取帮助:
- 微信:18217235290
- Email:[email protected]
- 博客:永春小站