Skip to content
Extraits de code Groupes Projets
Valider 88b4c33b rédigé par Nicolas RAYMOND's avatar Nicolas RAYMOND
Parcourir les fichiers

init

parent
Aucune branche associée trouvée
Aucune étiquette associée trouvée
Aucune requête de fusion associée trouvée
import camelot
import pandas as pd
file = "test.pdf"
tables = camelot.read_pdf(file, pages="1-end", flavor="stream")
print("Total tables extracted:", tables.n)
first_df = tables[1].df
first_df.iloc[1,1] = first_df.iloc[1,2]
first_df.drop(2,inplace=True,axis=1)
first_df.columns = range(first_df.columns.size)
df_list = [first_df]
if len(tables) > 2:
for table in tables[2:]:
df_list.append(table.df.iloc[2:])
r = pd.concat(df_list)
r.iloc[1:,0] = r.iloc[1:,2]
r[2] = ""
r.insert(1,"","")
r[0] = r[0].str.replace('.','/',regex=False)
r = r[r[0] != ""]
r.to_csv("foo.csv", sep=";",index=False, header=False)
0% Chargement en cours ou .
You are about to add 0 people to the discussion. Proceed with caution.
Terminez d'abord l'édition de ce message.
Veuillez vous inscrire ou vous pour commenter