Tekst uit PDF

  • Onderwerp starter Onderwerp starter EricL
  • Startdatum Startdatum
Status
Niet open voor verdere reacties.

EricL

Gebruiker
Lid geworden
7 mrt 2007
Berichten
12
Hoe ik tekst uit een PDF bestand kan halen, weet ik wel. Tekst selecteren, Ctrl C, dan Word openen en Ctrl V. En de tekst staat er. Maar...
De tekst in het betreffende pdf-bestand is tekst die in vijf kolommen naast elkaar staat (een pagina van een krant). In het Word-bestand zet 'ie die tekst wel keurig onder elkaar, maar hij houdt de kolombreeedte en de kolomafbrekingen ook in stand. En dat moet niet. Het moet gewoon een achter elkaar doorlopende tekst worden. Dus zonder harde returns. Hoe krijg ik dat voor elkaar? Iemand een idee? (Ik kan het handmatig doen, door de cursor achter een regel te zetten en te deleten, maar dat is wel erg veel werk, want het zijn erg lange tekstbestanden...)
 
volgens mij doet ie dat niet als je : opslaan als doet en dan ... . doc doet, dan neemt hij normaal het correct over, gewoon doorlopende tekst..
 
Dus wel. Als ik de tekst uit de pdf selecteer en kopieer in een Word-bestand en dat Word-bestand vervolgens opsla als .doc dan blijft die 'kolomtekst' gehandhaafd...
 
Had de vraag ook onder software > microsoft > word geplaatst, omdat daar Word-gebruikers misschien wat sneller kijken. Daar is de vraag inmiddels geblokkeerd. Dus daarom ga ik hier even in op een antwoord dat ik daar kreeg. Het zou op te lossen zijn in Word via zoek/vervang. Had ik al geprobeerd. Ik kan de 'harde return' in het zoekveld ook wel aangeven, maar dat moet 'ie dan vervangen door 'niets'. Maar wat is niets? Een spatie? Dat heb ik geprobeerd. Maar dat werkt dus niet. Er gebeurd niets.
 
Vervangen door een spatie.
Maar je moet zoeken naar einde paragraaf (was volgens mij de bovenste optie). Harde return o.i.d. werkte bij mij niet.
 
GELUKT. Het werkt! Zeer veel dank. Ik heb me rot gezocht naar een manier om dit probleem te tackelen. Nogmaals: Bedankt!
(Het heet overigerns 'alineamarkering', de bovenste optie...)
 
Kopieer naar htm bestand

Meestal genereert een copy past uit adobe de opmaak automatisch (zoals kolommen), om voor grotere documenten de copy paste iets praktischer te maken kan het best volgende stappen volgen:

  • Kopieer al je tekst onder elkaar in kladblok
  • Sla je kladblok document op met de extensie *.htm (bijvoorbeeld pdf.htm)
  • Open dit bestand in explorer of firefox en je krijgt tekst zonder opmaak of kolommen

Deze kan je dan copy-pasten naar een Word document, zonder opmaak

Meer praktische pdf tips op joit.be :thumb:
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan