RTF naar PDF conversie geeft soms rare tekens

Status
Niet open voor verdere reacties.

Joost.van.Steeg

Gebruiker
Lid geworden
9 okt 2006
Berichten
138
Gedurende een langere periode hebben we problemen met het genereren van PDF bestanden vanuit een RtF template waarin de place holders zijn gedefinieerd.
Dit gaat soms fout en soms niet.
Soms ziet men eerst de tekst goed staan in het PDF document gedurende een seconde waarna de onverklaarbare tekst verschijnt.
Voorbeeld.png

Momenteel gebruikt men Adobe V10

Weet iemand wat dit gedrag zou kunnen verklaren?
 
Hoe worden de PDF's gegenereerd? Ik heb dit wel eens eerder gezien als de pdf de inhoud van een blok letterlijk weergeeft ipv die te vertalen. Zijn de cijfers wel goed (in de voorbeeldfile)? lijkt een beetje op een code-tabel probleem.
 
Eerst nog even wat achtergrond informatie:
Er wordt gewerkt met een progamma dat APRO Banking heet.
In dit programma wordt een RTF template gekoppeld. (Deze heb ik reeds opnieuw aangemaakt om zeker te zijn dat er niet een fout in het sjabloon zit).
Vervolgens worden gegevens uit de database opgehaald en in een PDF bestand getoond.

@manamana: Om bovenstaande reden is het voor mij niet mogelijk om het bestand eerst met een andere extensie op te slaan.
@Wampier: Ik zal de RTF template ook even koppelen. Ik weet niet precies wat je bedoelt met het letterlijk vertalen van de inhoud van het blok.

Bedankt voor de reacties.

Groeten,
Joost.
 
PDF codeert tekst op een specifieke manier. Er wordt een basis geselecteerd en compressie toegepast. Het lijkt erop dat cijfers wel goed gedecodeerd worden maar tekst niet. Dat kan komen omdat de viewer de verkeerde codetabel pakt of het ontsleutelen van de tekst niet goed gaat. In beide gevallen zou ik de converter die het geheel naar PDF omzet het eerste verdenken.
 
Laatst bewerkt:
@Vampier. Scherp, het was mij nog niet opgevallen. De getallen lijken goed over te komen.
Maar ook hier vindt een vertaalslag plaats.
Zo wordt: 585212694 vertaald naar: /474101583
Deze vertaling is consequent.
Dat wil zeggen: overal waar bijvoorbeeld 694 hoort te staan komt 583 te staan.

Misschien dat je hier nog iets van af kan leiden.
Je advies is dus om op de converter zelf te concentreren?

Groeten,
Joost.
 
Ik kan me niet voorstellen dat er een andere verklaring is. Mogelijk is er nog iets anders corrupt, zoals het script wat de conversie / ophalen van de RTF verzorgt, maar de kans daarop is wel veel kleiner. Wat als je een RTF invoert zonder invoervelden, dus alleen pure tekst. Gebeurt het dan ook?
 
Dat zal ik gaan testen.
Volgens mij gaat dit wel goed.

Tevens valt het op dat bepaalde tekst wel altijd goed komt te staan (zoals de tekst Payment Letter).
Maar indien het fout gaat, gaat het fout bij de tekst wat in tabellen is opgenomen.
In de template staat bijvoorbeel:

Payment details:
------------------------------
Batch Name || <placeholder>|
Bank || <placeholder>|
------------------------------

Als het bestand foute output laat zien, dan blijft de tekst boven de tabel: "Payment details" netjes hetzelfde,
maar wordt zowel de opgegeven tekst in de linkerhelft van de tabel als de tekst die wordt opgenomen in de placeholder omgezet in onleesbare tekens.
Kan de tabel nog van invloed zijn?

Zojuist heb ik Foxit reader (stand alone) als standaard applicatie gebruikt voor het openen van PDF bestanden.
Helaas gaat dat niet goed. Er wordt namelijk geen output getoond. Ik denk dat de stand alone versie niet uitgebreid genoeg is voor de aanroepende applicatie om te converteren van RTF naar PDF.
 
Aanvullende informatie:
Vandaag zien we dat een nieuw gegenereerd PDF document de vreemde tekens toont. Vervolgens wordt het PDF bestand opgeslagen en naar mij verstuurd per mail voor analyse. Op het moment dat ik het bestand open, staan de gegevens correct. Zodra de persoon in kwestie het bestand heropent ziet hij de gegevens ook goed staan. Gevoelsmatig zou ik zeggen dat het dan niet meer zo zeer in de converter zit, maar in bijvoorbeeld actieve charactersets in de sessie van de gebruiker.
 
Dat zou kunnen, ware het niet dat PDF juist zo is gemaakt dat het onafhankelijk van de gebruiker altijd de juiste informatie moet tonen. Dat is juist het hele doel van PDF. Wat wel kan is dat het document niet juist wordt afgesloten voordat de preview getoond wordt. Dat zou verklaren dat het na heropening wel juist is.
 
Hoi Wampier,

Vandaag heb ik samen met de persoon in kwestie een test uitgevoerd.
In eerste instantie werd het PDF bestand getoond met de juiste gegevens in Adobe reader, na twee seconden wijzigden de gegevens naar de onleesbare tekens.
Hierna heb ik het bestand opgeslagen en heropent. De tekens werden opnieuw verkeerd getoond (nu direct). (deze actie heb ik een aantal keer herhaald, maar het resultaat bliijft hetzelfde).
Vervolgens heb ik het opgeslagen PDF bestand geopend met Foxit Reader. De gegevens worden dan goed getoond. Vervolgens heb ik het bestand opnieuw geopend met Adobe. De gegevens blijven hier corrupt.
Ik heb het bestand naar mijn mail verstuurd en geopend onder mijn gebruikers account met de centraal geinstalleerde Abobe reader. Hier worden de gegevens goed getoond.

Het probleem lijkt dan toch te zitten in de combinatie Gebruikers account - Adobe versie X.
Ik heb alle eigenschappen van Adobe op een rijtje gezet, en zie maar 1 verschil:
Zijn account toont onder Document properties, tabblad Description, onderdeel Advanced:
PDF Version: 1.4 (Acrobat 5.x)

Onder mijn account zie ik staan:
PDF Version: 1.5 (Acrobat 6.x)

Dat zou het dan toch moeten zijn volgens mij.
Denk jij dat dit het probleem zou kunnen verklaren?

Tevens zou ik verwachten dat ik onder Adobe versie 10 een 10.x bestand zou genereren ipv een adobe 5.x of een adobe 6.x, of zijn dit verschillende zaken?

Groeten,
Joost.
 
Laatst bewerkt:
De PDF wordt echter niet gegenereerd door adobe writer, maar door een plugin/script neem ik aan? Ik blijf het een vreemd verhaal vinden :) Blijkbaar is het includen van de velden een probleem. In principe zou het document natuurlijk dezelfde informatie moeten laten zien in beide versies.
 
Ik volg het zelf in ieder geval nog niet.
In principe werken we beide met dezeflde Adobe versie (10.0.1), alleen worden er bij ons verschillende waardes getoond bij de document eigenschappen.
Deze PDF Version waardes zeggen mij niets.
 
Update:
Men heeft een hersinstallatie van Adobe verricht (zelfde versie). Dit is kennelijk ook niet de oplossing.
Wel zien we dat wanneer de persoon de foutieve output zien, er in de document eigenschappen staat:
PDF Version: 1.4 (Acrobat 5.x)

Zodra de persoon een nieuwe sessie opstart en hetzelfde bestand wat eerder fout ging opnieuw opent, gaat goed.
Als we kijken naar de document eigenschappen zien we staan:
PDF Version: 1.5 (Acrobat 6.x)

Zodra de persoon weer een aantal nieuwe PDF's heeft aangemaakt, is de kans aanwezig dat het opnieuw fout gaat.
We doen vervolgens dezelfde bevindingen als hierboven.
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan