• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

pdf tekst inlezen via vba

Status
Niet open voor verdere reacties.

Sander32

Gebruiker
Lid geworden
26 jul 2012
Berichten
65
Wie o wie kan mij dringend helpen met pdf tekst inlezen via vba, bijv vanuit MS Excel.
Ik heb diverse codes gebruikt zoals:
Code:
'Note: A Reference to the Adobe Library must be set in Tools|References!
Dim AcroApp As CAcroApp, AcroAVDoc As CAcroAVDoc, AcroPDDoc As CAcroPDDoc
Dim AcroHiliteList As CAcroHiliteList, AcroTextSelect As CAcroPDTextSelect
Dim PageNumber, PageContent, Content, i, j
Set AcroApp = CreateObject("AcroExch.App")
Set AcroAVDoc = CreateObject("AcroExch.AVDoc")
If AcroAVDoc.Open(strFileName, vbNull) <> True Then Exit Function
' The following While-Wend loop shouldn't be necessary but timing issues may occur.
While AcroAVDoc Is Nothing
  Set AcroAVDoc = AcroApp.GetActiveDoc
Wend
Set AcroPDDoc = AcroAVDoc.GetPDDoc
For i = 0 To AcroPDDoc.GetNumPages - 1
  Set PageNumber = AcroPDDoc.AcquirePage(i)
  Set PageContent = CreateObject("AcroExch.HiliteList")
  If PageContent.Add(0, 9000) <> True Then Exit Function
  Set AcroTextSelect = PageNumber.CreatePageHilite(PageContent)
  ' The next line is needed to avoid errors with protected PDFs that can't be read
  On Error Resume Next
  For j = 0 To AcroTextSelect.GetNumText - 1
    Content = Content & AcroTextSelect.GetText(j)
  Next j
Next i
ReadAcrobatDocument = Content
AcroAVDoc.Close True
AcroApp.Exit
Set AcroAVDoc = Nothing: Set AcroApp = Nothing

Er word beweerd dat je een library moet refereren echter weet ik niet welke library.
A Reference to the Adobe Library must be set in Tools|References!
Wellicht kan iemand mij hiermee spoedig helpen dmv de juiste library te geven of een goed werkende code.
Alvast veel dank!

Sander
 
Laatst bewerkt door een moderator:
Precies zoals het daar staat, Tools|References (in de VBA editor dus) en dan die Adobe library aanvinken.
Dan moet je die library wel hebben uiteraard.
 
Beste Edmoor,

Zoals je waarschijnlijk al dacht, heb ik die library niet. Ik gebruik Office XP/2003 profesional. Kan ik deze Library ergens downloaden? Heb jij toevallig een link? Klinkt misschien wat dom, maar dit soort zaken weet ik niet.
 
Ik denk dat je die alleen kunt krijgen als je de Adobe Ontwikkelomgeving koopt. Daar zal 'ie bij meegeleverd worden.
Maar misschien dat iemand anders wat weet.
 
Is er dan geen ander manier om de tekst in te lezen. Als je een pdf opent kan je via CTRL A de tekst selecteren. Misschien dat er een creatieveling via een of ander browser dit heeft weten te ontrafelen. Dr moet toch een ander manier zijn. Het is tekst in een verpakt object maar is dmv bestand te openen toch te kraken. Hopen dat iemand mij hierin kan helpen.
 
Er bestaan freeware utilities die een PDF kunnen converteren naar tekst zodat je daarna alleen het tekstbestand hoeft in te lezen.
Zoek maar eens met Google naar pdftotext.
 
Die pdf to text, ik neem aan dat ik die via VBA kan aansturen en dan de text importeren? Het is wel de bedoeling dit te automatiseren en niet handmatig texten te kopieren. Ik ga nu op Google kijken
 
Een extern programma kun je vanuit VBA altijd via de Shell opdracht starten.
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan