• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

tabel in PDF naar Excel omzetten

Status
Niet open voor verdere reacties.

AlexCEL

Meubilair
Lid geworden
3 apr 2014
Berichten
8.838
Office versie
Excel 365 NL Insider
Ik ben op zoek naar goede ideeën om een tabel in PDF om te zetten naar excel. Het betreft het tweede gedeelte van bijgevoegd voorbeeld, de risico-inventarisatie.

Zie hier: Bekijk bijlage Directeur.pdf

Probleem is dat de tabel niet als zodanig herkenbaar is voor Excel. Kopiëren-Plakken gaat dus niet goed, en vereist nog steeds veel handenarbeid om het goed te krijgen. Als het nu om één bestand zou gaan is dit geen probleem, maar ik moet er vele omzetten/aanpassen/bewerken.

Heeft iemand nog een goede suggestie om de tabel wel vlot en netjes in Excel te krijgen?
 
had je al gegoogled op pdf omzetten naar excel? er zijn de nodige gratis online tooltjes die dat voor je kunnen doen.

en anders kan (iemand) met een betaalde adobe account dit soort bestanden weer "terug" converteren.
misschien heeft adobe ook wel proefabonnementen zodat je het zelf kan.
 
Daar heb ik ook naar gekeken, maar de tabel komt er nog steeds niet echt bruikbaar uit.

Ik moet eigenlijk kolommen kunnen aangeven die data bevatten bij importeren in excel, of bij het exporteren vanuit een andere programma. Dit heb ik nog niet voor elkaar gekregen helaas, ook niet met een volledige versie van Adobe Acrobat.
 
Geen Excel oplossing, maar ik denk een stap in de goede richting. Er is een tooltje PDFTOTEXT.exe. Als ik dit loslaat op de PDF krijg ik volgens mij een enigszins werkbare formatting. Ik gebruik het op het werk, maar volgens mij is het ook gewoon los (gratis) te downloaden.

Het is een commandline tool wat volgens mij ook prima in batch kan werken (heb ik geen ervaring mee). I.i.g. moet je wel de optie -table gebruiken, dus bv.
Code:
>pdftotext -table Directeur.pdf Directeur.txt

Voorbeeldoutput (deel)
Code:
Risicogebied                   Prioriteit  (Arbouw)  Risico / Aandachtspunt                       (Suggesties voor) maatregelen

Psychosociale factoren         1                     Tijdsdruk/ werkstress                        Zorg voor een goede werkorganisatie, bevorder samenwerking en communicatie

                                                     Men werkt vaak onder tijdsdruk               Denk aan uw leefstijl, zorg voor voldoende rust en herstel

                                                                                                  Zorg in drukke periodes voor een goede afstemming met de thuissituatie

                                                                                                  Laat het werkaanbod plannen

                                                                                                  Beperk uw werkzaamheden in de avonduren en in het weekend

                                                                                                  Inventariseer/ evalueer taakverdeling, taakinhoud en taakbelasting van directie, leidinggevend en stafpersoneel,

                                                                                                  delegeer zo mogelijk

Psychosociale factoren         1                     Tijdsdruk/ werkstress                        Delegeer taken aan leidinggevend en stafpersoneel

                                                     Verantwoordelijkheden zorgen voor een grote  Zorg ervoor dat tijdens directie- en stafvergaderingen problemen in een vroeg stadium worden gesignaleerd en

                                                     druk                                         bespreekbaar worden gemaakt

                                                                                                  Verbeter de communicatieve- en managementvaardigheden van het stafpersoneel, zonodig door een training

                                                                                                  Verbeter zonodig afstemming/ samenwerking met opdrachtgever, architecten, leveranciers, neven- en

                                                                                                  onderaannemers

                                                                                                  Voorkom conflicten
 
Dat ziet er al beter werkbaar uit. Ik ga deze optie eens uitproberen.

Bedankt voor de tip.
 
Peter,

ik ben weer even bezig met dit project van mij. Blijkt dat ik niet de juiste PDFTOTXT heb gedownload, het is geen commandline tool en geeft verkeerde (=geen) resultaten...

Dus bij deze de vraag: waar kan ik dat door jou gebruikte tooltje vinden?

Bij voorbaat dank.
 
Als ik in Foxit Reader de 'tabel' kopieer en plak.

In Excel de volgende macro gebruik:
Code:
Sub M_snb()
  With GetObject("New:{1C3B4210-F441-11CE-B9EA-00AA006B1A69}")
    .GetFromClipboard
    CreateObject("scripting.filesystemobject").createtextfile("G:\OF\arbo.txt").write .GetText
  End With
    
  Workbooks.OpenText "G:\OF\arbo.txt", 3, 1, 2, , , , , , , , , Array(Array(0, 1), Array(48, 1), Array(71, 1), Array(119, 1))
End Sub

Je vindt het programma pdftottext hier:

http://www.foolabs.com/xpdf/download.html

2e link onder precompiled binaries.
Downloaden en uitpakken in een nieuwe directory.
 
Laatst bewerkt:
Heb het programma gevonden en dit geeft aardige resultaten. Nog steeds bewerkingen noodzakelijk uiteraard, maar dat kan ik waarschijnlijk wel oplossen met wat mooie formules :)

Vraag is eerst opgelost, allen nogmaals hartelijk dank voor het meedenken.
 
Kijk ook eens naar het meegeleverde programma pdftohtml.exe; html-code kun je kopiëren en in Excel plakken met behoud van struktuur.
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan