• Privacywetgeving
    Het is bij Helpmij.nl niet toegestaan om persoonsgegevens in een voorbeeld te plaatsen. Alle voorbeelden die persoonsgegevens bevatten zullen zonder opgaaf van reden verwijderd worden. In de vraag zal specifiek vermeld moeten worden dat het om fictieve namen gaat.

CSV UTF 8

lexcellern

Gebruiker
Lid geworden
15 okt 2015
Berichten
130
Ik moet CSV bestanden als UTF-8 opgeslagen uploaden.
De bestanden laat ik maken vanuit een phyton script, maar als ik het laat wegschrijven als codering utf-8 bestand, dan worden de namen met leestekens vervormd weergegeven. Dat vind ik een onacceptabele fout.
Ik heb vervolgens het phyton script aangepast en laat het als codering latin1 wegschrijven.
Bij het uploaden komt dan de fout dat het geen UTF-8 is (maar het vervormen van namen met leestekens is dan wel opgelost).
Hetzelfde probleem gebeurt overigens als ik dit proces in een excel macro zou doen, maar dit even terzijde. ik wil het nu voornamelijk eerst werkende krijgen via deze weg.

Ik moet bij zo'n foutmelding eerst het bestand opnieuw openen en opslaan als UTF-8 en daarna gaat het wel goed.
Iemand een idee om dit probleem te verhelpen?

Kortom: hoe kunnen we ervoor zorgen dat leestekens niet vervormen bij utf-8
 
Je vergeet te vermelden hoe je het csv-bestand opent.
Gebruik in dit geval tab 'Data', optie 'from text'
Of in VBA

CSS:
Workbooks.OpenText "G:\OF\voorbeeld.csv", 65001, , 1, 1, , 0, -1, 0, 0, 0, , , , ",", "."

De tweede parameter 'origin' dient de waarde 65001 te krijgen.
 
ik heb het opgelost in het phyton script (mbv chatgpt).
Oplossing:

openen met: encoding='latin1'
wegschrijven met: encoding='utf-8-sig

die toevoeging -sig bleek belangrijk (en ook het openen met latin1, want openen met utf-8 of utf-8-sig ging ook fout)
 
Het is overigens Python, geen Phyton.

Omdat je niet vertelt hoe je het CSV-bestand opent heeft niemand iets aan je bericht.
 
Terug
Bovenaan Onderaan