WEBCLOUD.CZ | DOMENA.CZ

Svět hostingu - Vše o hostingu na jednom místě | Kontakt na redakci

Co je IDN

20.12.09autor: adminrubrika: Archív

Běžné domény jsou dnes zapisovány v kódování ASCII, což je kódování, se kterým si vystačí všechny znaky anglické abecedy. Myšlenka IDN spočívá v tom, vnést do názvů domén i jiné znaky a umožnit tak všem národům zapisovat a číst názvy domén v jejich mateřštině. Pro Čecha by měl mít tento systém „přínos“ v tom, že doménu bude možné zadávat a číst včetně diakritiky. Vyzkoušet to lze již nyní na doméně http://háčkyčárky.cz. IDN však nezůstává jen u písmenek s diakritikou – ambice jsou zde daleko větší. V praxi se tak běžně setkáme i s čínsky, japonsky, polsky, případně i rusky psanými doménami.

IDN není rozhodně záležitost posledního roku. Jak vyplývá z předchozího odstavce, otázka speciálních znaků v národní abecedě trápí především východní národy. Například Čína má podporu IDN zavedenou již od prosince 2000, Japonsko od února 2001. Jako první v Evropě byla IDN obdařena polská doména (.pl) a to již v září 2003. O několik měsíců později se pak přidali Švédové a Dánové.

Jak IDN pracuje?

V zásadě je třeba mít na paměti dvě hlavní zkratky. IDN (zmíněná výše) a IDNA, neboli Internationalizing Domain Names in Applications. První označuje domény, které mohou obsahovat všechny znaky z Unicode (tedy v podstatě jakýkoliv dnes existující znak), druhá pak jejich podporu v aplikacích. Problém tedy spočívá v tom, našroubovat tuto novou vlastnost na již existující systém DNS, který od svého vzniku počítá jen s ASCII názvy a který zcela jistě není záhodno v zájmu stability světa zbrkle měnit.

IDNA používá obvyklý trik, který známe už z dřívější doby (například z MIME). Potřebujeme-li do technologie omezené na ASCII znaky (zde DNS) dostat i další znaky, vymyslíme vhodné kódování, kterými je převedeme na (zpravidla delší) ASCII sekvenci.

Převod jména obsahujícího nejprapodivnější znaky probíhá ve třech krocích:

  • http://háčkyčárky.cz - pomocí různého mapování se zredukuje počet znaků a variant (převede na malá písmena a různé varianty vyjádření téhož převede na jednotnou formu). Řetězec zatím zůstává v Unicode.

  • Punycode (RFC 3492) převede znaky vybočující z ASCII na sekvence ASCII znaků.

  • Před výsledek získaný v


blog comments powered by Disqus
© 2017 Svět hostingu - vše o hostingu a doménách