Indeling van een boek, Streep tussen een woord, Pdf Formaat

Status
Niet open voor verdere reacties.

TURKGun86

Gebruiker
Lid geworden
21 feb 2008
Berichten
14
Hallo,

Mijn vraag gaat over de indeling van boeken. In een pagina van een boek, als aan het einde van een zin een woord tekort komt, wordt deze woord in twee stukken gedeeld en hiertussen wordt een streep-teken gezet.

Het probleem is dat ik een boek heb gescand(als ocr tekst) naar pdf formaat. Deze pdf formaat is niet te converteren naar html formaat. Ik wil dus de gescande tekst in de pdf formaat in een html document zetten. Dit kan door het te kopieren en plakken. Maar als je gaat kopieren en plakken gaat dan wordt de gehele html document(in de breedte niet gevuld), omdat er wordt uitgegaan van een boekformaat. Dus heb ik geprobeerd de text in de-text-view-van-Dreamweaver te zetten. Hierdoor wordt de gehele scherm wel gevuld, maar de indeling van de paragrafen zijn compleet verloren. De, in het normaal uitelkaar gedeelde woorden zijn nu aan elkaar, maar met de streepjes ertussen.

Weten jullie of in het programma Word, een optie is welke automatisch(zonder dat jij de paragrafen zelf hoeft te maken) paragrafen kan herinneren en maken, en ook de streep tussen elk woord kan verwijderen(dus het samenvoegen van een woord), waardoor mijn probleem wordt opgelost? Of kennen jullie andere softwares welke over deze functionaliteiten beschikken?
 
Hoi,

Scannen in PDF-formaat heb ik nooit gedaan, wel heel veel direct naar Word.
Uit je vraag blijkt dat er twee mogelijke oorzaken:

  1. er is sprake van een handmatig regeleinde aan het einde van elke regel
  2. er is sprake van een z.g. 'tijdelijk afbreekstreepje'
Je kunt dit in Word in beide gevallen laten verhelpen middels 'zoeken en vervangen' en bij zoeken de knop 'Meer...' en optie 'Speciaal' te kiezen, waarbij je een lijst met mogelijk te vervangen z.g. 'onzichtbare' of 'niet afdrukbare' tekens krijgt
 
Laatst bewerkt:
Het handmatig zoeken en vervangen wist ik al. Maar wat ik wou, was een programma die eerst automatisch herkent van waar de paragraaf begint, en dan automatisch de paragrafen maakt, m.b.v. de <p></p> tags. En hierbij ook herkenning van einde regel woord splitsen en automatisch samenvoeging.
 
Status
Niet open voor verdere reacties.
Steun Ons

Nieuwste berichten

Terug
Bovenaan Onderaan