Skip to content
Extraits de code Groupes Projets
Valider 50c6dbd4 rédigé par Nicolas RAYMOND's avatar Nicolas RAYMOND
Parcourir les fichiers

add args parser

parent 88b4c33b
Aucune branche associée trouvée
Aucune étiquette associée trouvée
Aucune requête de fusion associée trouvée
#! /bin/env python3
import camelot import camelot
import pandas as pd import pandas as pd
import argparse
import os
file = "test.pdf" arg_parser = argparse.ArgumentParser(
description="Un simple script de convertion de relevé LCL pdf vers csv")
tables = camelot.read_pdf(file, pages="1-end", flavor="stream") arg_parser.add_argument('path',
help="Chemin du relevé pdf à convertire")
arg_parser.add_argument("-o", "--out", default="%path%.csv",
help="Chemin du fichier csv de sortie")
arg_parser.add_argument("--full-label", action="store_true",
help="Exporte toutes les lignes du relevé (dont REF et LABEL)")
args = arg_parser.parse_args()
if args.out == "%path%.csv":
args.out = os.path.splitext(args.path)[0]+'.csv'
print("Convertion de "+args.path+" vers "+args.out)
tables = camelot.read_pdf(args.path, pages="1-end", flavor="stream")
print("Total tables extracted:", tables.n) print("Total tables extracted:", tables.n)
...@@ -21,5 +41,7 @@ r.iloc[1:,0] = r.iloc[1:,2] ...@@ -21,5 +41,7 @@ r.iloc[1:,0] = r.iloc[1:,2]
r[2] = "" r[2] = ""
r.insert(1,"","") r.insert(1,"","")
r[0] = r[0].str.replace('.','/',regex=False) r[0] = r[0].str.replace('.','/',regex=False)
r = r[r[0] != ""] if not args.full_label :
r.to_csv("foo.csv", sep=";",index=False, header=False) r = r[r[0] != ""]
r.to_csv(args.out, sep=";",index=False, header=False)
0% Chargement en cours ou .
You are about to add 0 people to the discussion. Proceed with caution.
Terminez d'abord l'édition de ce message.
Veuillez vous inscrire ou vous pour commenter