Welkom in de diepe valkuil van de internationale data encoding. Eens was er de uitvinding van hoe getypte dingen in bits omgezet konden worden om opgeslagen te worden op computers.. Gezien dit werk allemaal in Amerika werd gedaan paste alle mogelijke tekens mooi in 7 bits. Geen umlauts of andere crud waar inferieure talen en systemen mee worstelen, laat staan tekens in een ander alfabet dan a-z. Deze uitvinding werd ASCII genoemd en Amerika zag dat het goed was... En elk ander systeem van tekens en letters moet er maar mee leren leven.
Dat is ongeveer waar we zijn 60 jaar naar de invoering van ascii. Om encoding van alle mogelijke tekens op aarde mogelijk te maken is UTF-8 bedacht en geformaliseerd in 2003 (na bijna 50 jaar was het handig om misschien ook niet-amerikaanse tekens te kunnen gebruiken). Op het gebied van directe communicatie is UTF-8 momenteel (gelukkig) grotendeels de standaard. Het grootste deel van het internet (HTML /XML / JS / JSON) gebruikt UTF-8 en kan zodoende netjes Aziatische, Griekse, romaanse en Perzische scripts en tekens op een enkele pagina weergeven in een enkele encoding.
Helaas, voor e-mail is er voor het naamdeel pas een voorstel aanpassing geschreven in 2012. Nagenoeg niemand ondersteund het nog. Ook thunderbird niet voor het verzenden. Het probleem is dat het grootste deel van de servers niet deze standaard implementeren en/of niet juist doorgeven dat ze overweg kunnen met deze standaard. "Grappig" genoeg kun je wel mails ontvangen met deze tekens, maar niet aan een mailserver geven om te versturen. Even snelle zoektocht op internet leert dat eigenlijk alleen google dat al ondersteund.