russische tekst

Status
Niet open voor verdere reacties.

willem008

Gebruiker
Lid geworden
28 sep 2007
Berichten
792
Goede dag

Ik hoop dat ik het goed uitleg want ik snap het zelf nog niet wat er aan de hand is

Het volgende

Ik heb voor iemand een site gemaakt, heb daaraan een cms gekoppelt.
Nu heeft die persoon via de cms russische tekst ingevoert.
Als ik de site nu open op intenet staat er keurig de russische tekst.
Maar als ik op de server het bestand open staat er een groote reeks vreemde tekens.
Ook zag ik dat bijv bij internet exploder als ik in de bron kijk sommige pagina's goed zijn dus gewoon de russissche tekst, en andere weer die vreemde tekens.

heb al lopen zoeken op intenet maar ik begrijp niet wat er aan de hand is ,zal best een logische verklaring hebben.
 
De vreemde tekens in de HTML zijn de ASCII codes voor de Russische letters. ASCII is de standaard voor alle tekens en symbolen.
 
ok

maar waarom zie ik als ik in de bron code kijk via mijn browser
bij de ene pagina gewoon de tekst die ook getoont wordt op internet en bij een andere pagina van die site in het content weer een reeks vreemde tekens.


En wat moet er in bijv de descrision en keywoorden staan ivm de zoekmachine.

Ik kreeg van die persoon via een tekstbestand een russische tekst.
heb die gekopieert en in de pagina op de server geplakt , hij geeft dat een hele reeks
van het vlogende Д с б enz

hoop dat jij het snap ,ik ben er nog even niet uit
 
ok

maar waarom zie ik als ik in de bron code kijk via mijn browser
bij de ene pagina gewoon de tekst die ook getoont wordt op internet en bij een andere pagina van die site in het content weer een reeks vreemde tekens.


En wat moet er in bijv de descrision en keywoorden staan ivm de zoekmachine.

Ik kreeg van die persoon via een tekstbestand een russische tekst.
heb die gekopieert en in de pagina op de server geplakt , maar dat krijg ik een reeks vreemde tekens

hoop dat jij het snap ,ik ben er nog even niet uit

op mijn server staat zoiets
span style="font-size: 14px">Ð“Ð¾Ð»Ð»Ð°Ð½Ð´Ð¸Ñ &ndash; Ñто Ð¼Ð°Ð»ÐµÐ½ÑŒÐºÐ°Ñ Ñтрана, предÑтавлÑÑŽÑ‰Ð°Ñ Ð±Ð¾Ð»ÑŒÑˆÐ¸Ðµ возможноÑти Ð´Ð»Ñ Ð²Ñех и каждого во многих облаÑÑ‚ÑÑ….<br />
<br />
Мы готовы поделитьÑÑ Ñ Ð’Ð°Ð¼Ð¸ нашим Ñнтузмом и опытом в Ñледущих видах деÑтельноÑти:<br />
- БизнеÑ-уÑлуги в Голландии<br />
- ПоÑещение Голландии<br />
 
Zet de charset eens op utf-8? (evt. php headers: header('content-type: text/html;charset=utf-8');)


:thumb:
 
deze staat in in mijn head

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

en zo ziet het hele html eruit op de server.

alleen in de description en in de keywords stonden codes zoals _ Q)
maar door het copieeren en plakken is het veranderd in leesbare russische tekst(zoals hier onder)




<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="nl" lang="nl">

<head>

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

<link rel="stylesheet" href="style.css" type="text/css" />


<meta name="description" content="Russia4you, Мы знаем о Голландии все, Ваш бизнес в Голландии начинается здесь, Голландия для бизнесменов и туристов, Голландско-русская команда, Переводческие услуги с голландского и на голландский, Бизнес-услуги в Голландии" />

<meta name="keywords" content="Голландия, Нидерланды, голландский, нидерландский, бизнес в Голландии, Амстердам, переводчик голландского, перевод с голландского, перевод на голландский, посещение Голландии, отдых в Голландии, туры в Голландию, представительство в Голландии, голландские компании, нидерландские компании, поездка в Голландию, русско-голландский, голландско-русский, регистрация фирмы в Нидерландах, регистрация компании в Голландии, Роттердам, Гаага" />

<meta name="robots" content="index, follow" />

<meta name="revisit-after" content="3 days" />

<meta name="wlvdmeer" content="webmaster wlvdmeer" />

<title>

Добро пожаловать на Russia4you – Ваш компас по Голландии!

</title>
<script type="text/javascript">

var _gaq = _gaq || [];
_gaq.push(['_setAccount', 'UA-20457397-1']);
_gaq.push(['_trackPageview']);

(function() {
var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
})();

</script>

</head>



<body>

<div id="hoofdcontainer">
<div id="header"><img class="cushycms" src="image/banner12.jpg" id="logo" height="200" alt="russia4you" width="958" /></div>

<div id="menu"></div>

<div id="content">

<div id="homeknop"><a href="startrus.html" title="russia4you"><img src="image/homerus.png" width="123" height="24" class="border" alt="Home" /></a></div>
<div id="project"><a href="projectrus.html"><img src="image/projectrus.png" width="123" height="24" class="border" alt="project" /></a></div>
<div id="contact"><a href="contactrus.html"><img src="image/contactrus.png" width="123" height="24" class="border" alt="contact" /></a></div>
<div id="vlagnl"><a href="index.html"><img src="image/vlagnl.png" width="30" height="20" class="border" alt="nederland" /></a></div>
<div id="vlagrus"><a href="startrus.html"><img src="image/vlagrus.png" width="30" height="20" class="border" alt="rusland" /></a></div>


<div class="inhoud2"><div id="inhoud">





<div class="cushycms" id="tekst"><p style="text-align: center">
<span style="font-size: 16px"><em><strong>Добро пожаловать на Russia4you &ndash; Ваш ÐºÐ¾Ð¼Ð¿Ð°Ñ Ð¿Ð¾ Голландии!</strong></em></span></p>
<p>
<span style="font-size: 14px">Russia4you &ndash; Ñто голландÑко-руÑÑÐºÐ°Ñ ÐºÐ¾Ð¼Ð°Ð½Ð´Ð°, Ð³Ð¾Ñ‚Ð¾Ð²Ð°Ñ Ñ€ÐµÐ°Ð»Ð¸Ð·Ð¾Ð²Ð°Ñ‚ÑŒ вÑе ваши планы в отношении Голландии.</span><br />
<br />
<span style="font-size: 14px">Ð“Ð¾Ð»Ð»Ð°Ð½Ð´Ð¸Ñ &ndash; Ñто Ð¼Ð°Ð»ÐµÐ½ÑŒÐºÐ°Ñ Ñтрана, предÑтавлÑÑŽÑ‰Ð°Ñ Ð±Ð¾Ð»ÑŒÑˆÐ¸Ðµ возможноÑти Ð´Ð»Ñ Ð²Ñех и каждого во многих облаÑÑ‚ÑÑ….<br />
<br />
Мы готовы поделитьÑÑ Ñ Ð’Ð°Ð¼Ð¸ нашим Ñнтузиазмом и опытом в Ñледущих видах деÑтельноÑти:<br />
- БизнеÑ-уÑлуги в Голландии<br />
- ПоÑещение Голландии<br />
- ПереводчеÑкие уÑлуги<br />
<br />
<strong>Мы предлагаем:</strong><br />
<em>БизнеÑ-уÑлуги в Голландии</em><br />
ПредÑтавление ваших интереÑов, бизнеÑ-иÑÑледованиÑ, поиÑк деловых партнеров,<br />
поиÑк, налаживание и поддержание контактов, поддержка учаÑÑ‚Ð¸Ñ Ð² выÑтавках и других мероприÑтиÑÑ… и многое другое.<br />
<em>ПоÑещение Голландии:</em><br />
ÐžÑ€Ð³Ð°Ð½Ð¸Ð·Ð°Ñ†Ð¸Ñ Ð´ÐµÐ»Ð¾Ð²Ð¾Ð³Ð¾ или чаÑтного поÑÐµÑ‰ÐµÐ½Ð¸Ñ (гоÑтиница, транÑпорт), Ñопровождение и переводчеÑкие уÑлуги.<br />
<em>ПереводчеÑкие уÑлуги:</em><br />
УÑтные и пиÑьменные переводы Ñ Ð³Ð¾Ð»Ð»Ð°Ð½Ð´Ñкого на руÑÑкий и Ñ Ñ€ÑƒÑÑкого на голландÑкий.<br />
Переводы любой тематики: юридичеÑкие, техничеÑкие, ÑкономичеÑкие, компьтерные, веб-Ñайты и другие.<br />
Перевод дипломированным переводчиком Ñ 18 летним опытом работы.<br />
Ðотариальное заверение переводов.<br />
УÑтные переводы в Голландии и РоÑÑии во Ð²Ñ€ÐµÐ¼Ñ Ð´ÐµÐ»Ð¾Ð²Ñ‹Ñ… мероприÑÑ&#³Ð¾Ð²Ð¾Ñ€Ð¾Ð², презентаций, выÑтавок, поездок), а также в чаÑтном порÑдке.<br />
<br />
<strong>Ðаши преимущеÑтва:</strong><br />
- ОтÑутÑтвие Ñзыкового барьера: мы говорим по-руÑÑки и по-голландÑки.<br />
- Гибкий подход к каждому клиенту: мы думаем вмеÑте Ñ Ð²Ð°Ð¼Ð¸.<br />
- Знание роÑÑийÑкого и голландÑкого менталитета, реалий и традиций.<br />
- И, конечно же, наша любовь к Голландии.</span></p>
<p style="text-align: center">
<span style="font-size: 14px">Мы знаем о Голландии вÑе!&nbsp;Мы вÑегда к вашим уÑлугам!</span><br />
<br />
<span style="font-size: 16px"><em><strong>Ð’ÑÑ Ð“Ð¾Ð»Ð»Ð°Ð½Ð´Ð¸Ñ Ð´Ð»Ñ Ð’Ð°Ñ &ndash; До вÑтречи в Голландии!</strong></em></span><br />
&nbsp;</p>
</div></div></div>









</div>
</div>

</body>

</html>
 
Laatst bewerkt:
Het zou er ook aan kunnen liggen,met welke text-viewer je de bestanden op de server bekijkt.
Ik merk het volgende:
  • Als ik in Firefox van russia4you.nl/startrus.html de broncode opvraag, krijg ik de inhoud keurig in russische lettertekens.
  • Als ik in Internet Explorer dezelfde broncode opvraag, staat de inhoud in de abracadabra-tekens.
  • Maar IE gebruikt Kladblok voor het weergeven van broncodes, en FF iets anders.
Als ik de pagina download, en open met Kladblok, krijg ik weer de abracadabra:
HTML:
<span style="font-size: 16px"><em><strong>Добро пожаловать на Russia4you &ndash; Ваш ÐºÐ¾Ð¼Ð¿Ð°Ñ Ð¿Ð¾ Голландии!</strong></em></span>
Maar als ik dezelfde gedownloade pagina open met Notepad++, krijg ik de mooie russische tekens:
HTML:
<span style="font-size: 16px"><em><strong>Добро пожаловать на Russia4you &ndash; Ваш компас по Голландии!</strong></em></span>
Met vriendelijke groet,
CSShunter
 
ok

maar ik zit met het volgende

als ik bebestanden rechtstreeks op mijn sever open ,staan die vol met abracadabra
ook de title ,keywoorden en description lijkt mijn niet de bedoeling ivm de zoekmachine

Het is nu zo dat de pagina's gevult zijn met een cms systeem en wel in rusland dus met een russische computer.

het gaat en mijn nu om hoe moet ik nu zelf bijv de keywoorden invullen
 
Hoi Willem,
De <title>, <meta name="keywords" content="..."> en de description heeft geen abracadabra zoals in de IE-bronweergave van de inhoud, maar bestaat uit de zg. Hash-notatie van de Russische lettertekens.
Als je de pagina een <meta> met de charset UTF-8 hebt gegeven (en dat heb je), en de pagina ook als utf-8 is opgeslagen, dan maakt het volgens mij geen verschil of je de Hash-notatie of de Russische letters zelf gebruikt.
Als proef op de som heb ik de Hash van de titel:
[js]Добро пожаловать на Russia4you - Ваш компас по Голландии![/js]
even "vertaald" in het Russisch:
Code:
Добро пожаловать на Russia4you - Ваш компас по Голландии!
(alleen het vraagtekentje in het midden moet een gewoon streepje zijn)

Vervolgens heb ik Google naar de Russische titel laten zoeken:
En dan komt de site dus feilloos tevoorschijn. :)

Met vriendelijke groet,
CSShunter
 
Laatst bewerkt:
ben een beetje een het zoeken geweest het probleem schrijnt ook met de charset te maken te hebben

ik heb nu charset=utf-8

als ik hem verander in
<meta http-equiv="content-type" content="text/html;charset=ISO-8859-1">
wat mijn is verteelt dat moet bij bijv russiche letters , dan wordt de hele pagina
acrabadabra.

Zo het dan zo wezen dat ik de pagina dan opnieuw moet maken met de nieuwe charset
 
Ai! :o
Het zal weer niet zo zijn... Internet Explorer doet het anders dan Firefox, waarin ik het bovenstaande getest heb.
IE7 geeft vraagtekentjes in de titel, en geeft ook niet dezelfde Google-opdracht... :(

Wordt vervolgd!
CSShunter
 
Gelukkig ... loos alarm! :)
Als je de link naar Google in nr. #9 hierboven opent in Internet Explorer (7 heb ik), dan gaat het fout.
Maar je in IE de Russische tekst opgeeft in het Google-zoekvenstertje van IE zelf, gaat het wel goed.

De UTF-8 doet het prima, en het lijkt dus gewoon goed te gaan met beide notaties in de <title> enz. Kortom:
  • Ik denk dat je rustig voort kunt gaan zoals het nu gaat. :)
  • UTF-8 gewoon handhaven.
  • En afhankelijk van hoe je de tekst voor title, description en keywords aangeleverd krijgt kan je de Russische of de Hash notatie gebruiken voor het inplakken.
  • De abracadabra in de teksten van de inhoud blijkt dus een derde notatie-vorm te zijn (de Unicode notatie, het middelste kolommetje in de tabel), en kan ook blijven staan.
= = = = = = = = = =

Wat ik wel zou doen, is in de Russische pagina's van de site de taal van de tekst:
HTML:
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="nl" lang="nl">
ook omzetten in Russisch:
HTML:
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ru" lang="ru">
Met vriendelijke groet,
CSShunter
 
Laatst bewerkt:
russia-iso.html
HTML:
<!--
   deze geeft dus de rare tekens:

   Добро пожаловать на Russia4you – Ваш ÐºÐ¾Ð¼Ð¿Ð°Ñ Ð¿Ð¾ Голландии!

   ook de p's title geeft rare tekens
-->
<!doctype html>

<html lang='ru'>

   <head>

      <meta charset='ISO-8859-1' />

      <title>russia - ISO-8859-1</title>

   </head>

   <body>

      <p title='Голландии'>
         Добро пожаловать на Russia4you – Ваш компас по Голландии! 
      </p>

   </body>

</html>

russia-utf8.html
HTML:
<!--
   deze geeft dus mooi:

   Добро пожаловать на Russia4you – Ваш компас по Голландии!
-->
<!doctype html>

<html lang='ru'>

   <head>

      <meta charset='utf-8' />

      <title>russia - utf-8</title>

   </head>

   <body>

      <p title='Голландии'>
         Добро пожаловать на Russia4you – Ваш компас по Голландии! 
      </p>

   </body>

</html>
De text is ook in de bron goed (bij utf-8, niet bij iso); het idee is (denk ik!) dat page-source ook eerst eventjes kijkt naar welke encoding het is.

Overgens kan je even voor de lol in firefox op ctrl+i drukken; dat geeft een scherm met pagina-info. Er is een item 'encoding', en deze moet dus op utf-8 staan. Zo niet, dan is er waarschijnlijk wat fout gegaan in je HTML syntax; check de validator.

De taal schijnt niet uit te maken; lang='ru' en lang='de' geeft hetzelfde resultaat. (Maar: zoekmachine's zijn het daar vast niet mee eens!)
 
Laatst bewerkt:
ja ja

gaat me nu dagen.

ik heb de html pagina gewoon opgeslagen dan staat hij automatische op

codering "ANSI"

dus ik heb hem nu opgeslagen als UTF8
zal daar de fout zitten zoja hoe zit het dan met de andere pagina's met alleen hollandse tekst.

Daar staat ook de charset UTF8 in maar is ook opgeslagen als ANSI,

Heeft dan die die charset geen zin of werkt dat zo niet
 
Laatst bewerkt:
De taal schijnt niet uit te maken; lang='ru' en lang='de' geeft hetzelfde resultaat. (Maar: zoekmachine's zijn het daar vast niet mee eens!)
Dat klopt (2x):
  • voor de codering maakt het niet uit,
  • voor zoekmachines wel (als je "Pagina's geschreven in het Russisch" met Google zoekt, zullen de pagina's met lang="de" mooi overgeslagen worden).
Voorleesbrowsers zullen het er verder ook niet mee eens zijn dat de lang="..." niet uitmaakt: die gaan dan Russisch op z'n Duits proberen uit te spreken als er lang="de" staat, en waarschijnlijk Russisch op z'n Engels als er géén lang="..." is opgegeven.
Zo worden geheel nieuwe talen geboren! :D

Hoe zit het dan met de andere pagina's met alleen hollandse tekst.
Daar staat ook de charset UTF8 in maar is ook opgeslagen als ANSI,
Heeft dan die die charset geen zin of werkt dat zo niet?
Jazeker wel, ook die kunnen het beste als UTF-8 worden opgeslagen als ze UTF-8 in de charset hebben staan.
Het voordeel is dan o.a. dat je niet met de hand de Hash-codes voor speciale lettertekens, of de "vriendelijke namen" daarvoor (zoals &agrave; &copy;, enz.) in de code moet zetten.
In plaats van bv.
HTML:
Notari&euml;le bekrachtiging van de taalbarri&egrave;re
kan je de gewone toetsenbord-tekens achter elkaar blijven doortikken:
HTML:
Notariële bekrachtiging van de taalbarrière.
Of zoiets. ;)

Met vriendelijke groet,
CSShunter
 
Status
Niet open voor verdere reacties.
Terug
Bovenaan Onderaan