Cum importăm fișiere PDF în Excel cu Power Query?

Formatul PDF-ul este unul din cele mai folosite în zona de afaceri. PDF-urile pot fi vizualizate, descărcate, trimise prin e-mail sau printate cu ușurință. Dar editarea sau extragerea datelor din fișiere PDF poate fi mai dificilă, mai ales atunci când ai nevoie să extragi datele din PDF în fișiere Excel!

Există mai multe situații în care ai putea să imporți un document PDF în Excel. Câteva din acestea pot fi următoarele:

  • primești documente contabile de la parteneri pe care este necesar să le verifici cu propriile înregistrări (de ex fișe de partener),
  • prelucrezi extrase bancare pentru import în programul contabil/ERP-ul companiei
  • sau prelucrezi facturi de furnizori pentru întocmire NIR.

Excel are o funcționalitate integrată în Power Query cu care poți importa și converti rapid un PDF în Excel. Aceasta funcționalitate detectează datele stocate într-un format de tabel sau poate extrage toate datele dintr-o pagină dacă conținutul necesar nu este într-un format de tabel.

Iar împreună cu caracteristicile de curățare a datelor din Power Query poți pregăti datele înainte de a fi importate.

Disponibilitate

Posibilitatea de a importa fișiere PDF folosind Power Query în Excel a fost introdusă în versiunea Beta în 2020. 

Iar acum este disponibilă pentru toți utilizatorii de Office365.

Pași necesari pentru a importa un PDF în Excel

În acest articol vom parcurge împreună pașii necesari pentru importul informațiilor legate de produsele dintr-o factură PDF în Excel:

În fișierul Excel în care dorești importarea datelor din PDF selectează tab-ul Data.

Aici selectează Get Data -> From File -> From PDF 

În fereastra care se deschide selectează fișierul PDF dorit și apasă butonul Import. Pentru exemplul din acest articol am selectat factura.

În acest moment se va deschide fereastra Navigator, care va fi afișa lista cu toate seturile de date pe care Power Query le-a identificat în PDF.

În prima parte a listei vei găsi tabele de date, iar în partea de jos paginile documentului PDF.

Dacă dorești să imporți mai mult de un set de date, bifează caseta Select multiple items. Dacă nu ești sigur care este tabelul care conține informațiile necesare, poți selecta fiecare element din lista din stânga pentru a afișa o previzualizare a conținutului în partea din dreapta.

Selectează tabelul sau pagina dorită și apasă butonul Transform Data.

În exemplul de azi am selectat Table003.

Datele selectate vor fi aduse în Editorul Power Query unde pot fi curățate și/sau modificate pentru a se potrivi nevoilor.

La importul în Power Query, cel mai probabil, titlurile tabelului vor fi introduse pe primul rând al acestuia.

Pentru a remedia acest lucru, apasă pe pictograma meniu din stânga tabelului și selectează opțiunea Use first row as header.

În exemplul nostru, tabelul a fost importat cu un rând liber înainte de rândul care conține titlurile coloanelor. Astfel, mai întâi este nevoie să ștergem acest rând.

După ce prelucrarea datelor este finalizată, selectează Close & Load pentru a încărca datele extrase într-un tabel Excel.

Te invit să urmărești aplicarea tuturor pașilor de mai sus în următorul video:

Concluzie

Funcționalitatea de import date integrată Power Query este una super utilă.

În ultima perioada am ajuns să folosesc importul din PDF foarte des și m-a ajutat să extrag informțiile de care aveam nevoie foarte ușor și foarte rapid.

Folosește zona de comentarii pentru a împărtăși experiența ta sau alte sfaturi utile legate de importul datelor în Excel din alte documente prin Power Query.

Print Friendly, PDF & Email

Leave a Reply

Your email address will not be published. Required fields are marked *