Importa dati da PDF à Excel via Power Query

U compitu di trasferimentu di dati da una spreadsheet in un schedariu PDF à una foglia Microsoft Excel hè sempre "divertente". In particulare se ùn avete micca un software di ricunniscenza caru cum'è FineReader o qualcosa cusì. A copia diretta di solitu ùn porta à nunda di bonu, perchè. dopu avè incollatu i dati copiati nantu à u fogliu, u più prubabilmente "fighjenu" in una colonna. Allora duveranu esse separati cù cura cù un strumentu Testu per colonne da a tabulazione Dati (Dati - Testu à Colonne).

E sicuru, a copia hè pussibule solu per quelli schedari PDF induve ci hè una capa di testu, vale à dì cù un documentu chì hè statu scansatu da carta à PDF, questu ùn funziona micca in principiu.

Ma ùn hè micca cusì tristu, veramente 🙂

Sè vo avete Office 2013 o 2016, dopu in un paru di minuti, senza prugrammi supplementari, hè abbastanza pussibule di trasfiriri dati da PDF à Microsoft Excel. E Word è Power Query ci aiuterà in questu.

Per esempiu, pigliemu stu rapportu PDF cù una mansa di testu, formule è tavule da u situ web di a Cummissione Economica per l'Europa:

Importa dati da PDF à Excel via Power Query

... è pruvate à tirà fora di questu in Excel, dì a prima tavola:

Importa dati da PDF à Excel via Power Query

Andemu!

Passu 1. Open PDF in Word

Per una certa raghjone, pocu persone sanu, ma dapoi u 2013 Microsoft Word hà amparatu à apre è ricunnosce i schedari PDF (ancu scansati, vale à dì senza una capa di testu !). Questu hè fattu in una manera cumpletamente standard: apre Word, cliccate File - Open (File - Apertu) è specificate u formatu PDF in a lista drop-down in u cantonu in basso à destra di a finestra.

Allora selezziunate u schedariu PDF chì avemu bisognu è cliccate Open (Apertu). Word ci dice chì hà da eseguisce OCR nantu à stu documentu à testu:

Importa dati da PDF à Excel via Power Query

Semu d'accordu è in pochi secondi vedemu u nostru PDF apertu per edità digià in Word:

Importa dati da PDF à Excel via Power Query

Di sicuru, u disignu, stili, fonts, headers è footers, etc., volaranu parzialmente da u documentu, ma questu ùn hè micca impurtante per noi - avemu solu bisognu di dati da e tavule. In principiu, in questa tappa, hè digià tentativu di simplificà a copia di a tavola da u documentu ricunnisciutu in Word è solu incollà in Excel. Calchì volta funziona, ma più spessu porta à ogni tipu di distorsioni di dati - per esempiu, i numeri ponu turnà in date o restanu testu, cum'è in u nostru casu, perchè. PDF usa micca separatori:

Importa dati da PDF à Excel via Power Query

Allora ùn tagliu micca i cantoni, ma fate tuttu un pocu più complicatu, ma ghjustu.

Passu 2: Salvà u Documentu cum'è una Pagina Web

Per poi carica i dati ricevuti in Excel (via Power Query), u nostru documentu in Word deve esse salvatu in u formatu di a pagina web - stu formatu hè, in questu casu, un tipu di denominatore cumuni trà Word è Excel.

Per fà questu, andate à u menu File - Salvà cum'è (File - Salvà cum'è) o appughjà a chjave F12 nant'à u teclatu è in a finestra chì apre, selezziunate u tipu di schedariu Pagina web in un schedariu (Pagina Web - File unicu):

Importa dati da PDF à Excel via Power Query

Dopu avè salvatu, duvete ottene un schedariu cù l'estensione mhtml (se vede l'estensione di u schedariu in Explorer).

Stage 3. Uploading the file to Excel via Power Query

Pudete apre u schedariu MHTML creatu in Excel direttamente, ma allora avemu da ottene, prima, tuttu u cuntenutu di u PDF in una volta, cù u testu è una mansa di tavule innecessarii, è, in segundu, perderemu di novu dati per via di sbagli. separatori. Dunque, faremu l'importazione in Excel per mezu di l'add-in Power Query. Questu hè un add-on cumplettamente gratuitu cù quale pudete caricate dati à Excel da quasi ogni fonte (fichi, cartulare, basa di dati, sistemi ERP) è poi trasfurmà e dati ricevuti in ogni modu pussibule, dendu a forma desiderata.

Se avete Excel 2010-2013, pudete scaricà Power Query da u situ web ufficiale di Microsoft - dopu a stallazione vi vede una tabulazione. dumanda di putenza. Se avete Excel 2016 o più recente, allora ùn avete micca bisognu di scaricà nunda - tutte e funziunalità sò digià integrate in Excel per difettu è si trova nantu à a tabulazione. Dati (Data) in gruppu Scaricate è cunvertisce (Ottieni & Trasfurmà).

Allora andemu sia à a tabulazione Dati, o nantu à a tabulazione dumanda di putenza è sceglite una squadra Per piglià dati or Crea Query - From File - From XML. Per fà visibili micca solu i fugliali XML, cambiate i filtri in a lista drop-down in l'angulu inferjuri destra di a finestra Tutti i fugliali (Tutti i schedari) è specificate u nostru schedariu MHTML:

Importa dati da PDF à Excel via Power Query

Per piacè nutate chì l'importazione ùn hà micca finitu bè, perchè. Power Query aspetta XML da noi, ma in realtà avemu un furmatu HTML. Dunque, in a prossima finestra chì appare, vi tuccherà à cliccà dritta nant'à u schedariu incomprensibile à Power Query è specificà u so furmatu:

Importa dati da PDF à Excel via Power Query

Dopu questu, u schedariu serà ricunnisciutu bè è vedemu una lista di tutte e tavule chì cuntene:

Importa dati da PDF à Excel via Power Query

Pudete vede u cuntenutu di e tavule clicchendu u buttone manca di u mouse in u fondu biancu (micca in a parolla Table!) Di e cellule in a colonna Dati.

Quandu a tavula desiderata hè definita, cliccate nantu à a parolla verde Table - è "cadute" in u so cuntenutu:

Importa dati da PDF à Excel via Power Query

Resta à fà uni pochi di passi simplici per "pettina" u so cuntenutu, à dì:

  1. sguassate e colonne inutili (cliccate cù u dirittu nantu à l'intestazione di a colonna - Eliminar)
  2. rimpiazzà i punti cù virgule (selezziunate colonne, cliccate right-click - Sustituitu i valori)
  3. sguassate i segni uguali in l'intestazione (selezziunate e colonne, cliccate right-click - Sustituitu i valori)
  4. caccià a linea superiore (Home - Sguassà e linee - Sguassate e prime linee)
  5. caccià e linee in biancu (Casa - Sguassà e linee - Sguassate e linee viote)
  6. elevà a prima fila à l'intestazione di a tavola (Casa - Aduprate a prima linea cum'è intestazioni)
  7. filtrà i dati inutili cù un filtru

Quandu a tavula hè purtata à a so forma normale, pò esse scaricata nantu à u fogliu cù u cumandamentu chiudi e scarica (Chiudi & Carica) on u principale tab. È averemu una tale bellezza cù quale pudemu digià travaglià:

Importa dati da PDF à Excel via Power Query

  • Trasfurmà una Colonna à una Tavola cù Power Query
  • Dividendu u testu appiccicosu in colonne

Lascia un Audiolibro