O češtině na internetu
Češi vzdychají a vymýšlejí si kódy Kamenických
Vazeny pane Hurychu,
dovoluji si nekolik poznamek k Vasemu clanku v Britskych listech: Vrava
je na míste, ale nejde vyvolavat umele.
1) Nektere priciny uspechu anglictiny ve vypocetni technice jsou zcela
prozaicky technickeho charakteru, k jejich pochopeni neni vubec zapotrebi
jakykoliv lingvisticky, filosoficky ci ideologicky vyklad. Jednim z nich je
jednoduchost grafické reprezentace textu - anglictina nepouziva krome
apostrufu zadne exoticke znaky, zadna diakriticka znamenka, vystaci s holou
latinskou abecedou, ktera je dosazitelna na kteremkoliv pocitaci.
Dodnes
snad jedinym problemem bylo pouziti dvou prevazujicich kodu: EBCDIC a ASCII
(ten dnes prevazil) a na historickych pocitacich tiskarny bez malych pismen.
Pri srovnani s problemy napr. cestiny, jejimu dvojimu kodovani na PC (v DOSu
a ve Windows), nemluve o odlisnem mezinarodnim standardu ISO-8859-2 (uzivan
v UNIXu) a o bici zvanem kod Kamenickych, ktery si na sebe upletli Cesi
sami.
Samozrejme, na mezinarodni urovni jsou dnes tyto problemy řešeny
16-bitovým kódem UNICODE a normou ISO 10646, jejich úsporne kodovani napr.
normou RFC 2279 (UTF-8). Ovsem zatimco dnes napr. Japonci bezne komunikuji
pomoci Internetu a elektronicke posty v narodnim jazyce a v narodni abecede,
Cesi stale vzdychaji, vymysleji si kody Kamenickych, elektronicka posta je
dodnes bezpecna jen v "telegrafni" cestine bez diakritiky.
Kdyz jsem v
70-tych letech spravoval pocitacovou databazi s texty v plne cestine, byl
jsem prirozene exot, ale kupodivu dodnes na mne podobne pohlizeji cesti
"opravdovi programatori", kdyz pokladam za samozrejmost pracovat na pocitaci
v plne cestine a s vyuzitim odpovidajicich grafickych nastroju.
Krome toho Americane, kdyz vymysleli svuj telegraf (odtud pochazi kod
ASCII), realizovali, na rozdil od Evropy, vetsi kulturu prenasene informace,
proto napr. telegraf s takovym uspechem vytlacil Ponny Express, a ta kultura
je dnes vyuzivana i v Internetu.
2) Neohebnost slov v anglicke gramatice vyrazne zjednodusuje kontextove
vyhledavani, hledani preklepu a gramatickych chyb. Zatimco ceske slovo
musite pro jednoduchy hledac preklepu uvest ve vsech moznych gramatickych
formach, v anglictine vystacite s jednim nebo nekolika malo tvary. Pri
kontextovem vyhledavani v cestine musite zkusit ruzne varianty promenliveho
kmene slova, v anglictine to plati jen pro nekolik nepravidelnych sloves.
3) Zatimco nektere narody - napr. Cesi ci Nemci - si libuji na slozita
gramaticka pravidla s jeste vetsi radou vyjimek, pravidla anglicke fonetiky
i gramatiky jsou jednoducha: Kdyz nevis vyslovnost, podivej se do slovniku,
na deleni slov je delici slovnik, ktery ma kazda pisarka v supliku (pokud
neni soucasti editoru). Zatimco napr. Nemci pisi sva slozena slova
dohromady, takze se v nich lze nekdy tezce orientovat, anglicane pisi mezi
jednotliva slova mezery (a pokladaji je za adjektiva), coz zjednodusuje
formalni interperetaci.
4) Abecedni razeni anglictiny je prisne lexikograficke, chybi tam podobne
perlicky jako "ch", respektovani ci ignorovani diakritickych znamenek apod.
Tyto "malickosti" silne znevyhodnuji cestinu a u nekterych by stalo za to se
zamyslet, zda jsou v jazyce nezbytne nebo jen zbytecnou prekazkou jejiho
vyuzivani na pocitacich. Pokud si Nemci dovolili zasadni pravopisnou
reformu, meli bychom se i my zamyslet, zda napriklad zvlastni razeni "ch" je
tak nezbytne.
Jednim z duvodu zavedeni zvlastniho razeni sprezek typu "ch" napr. do
jazykove podpory ve Windows bylo nemecke "ostre S" razene jako "ss". Nemcu
je mnoho, proto ztrata takoveho trhu je citelna. Mozna ze dnes, kdy Nemci
tento exot zrusili, by se nikdo s takovou komplikaci neobtezoval.
4) Prednost maji samozrejme hojne pouzivane jazyky - odladeni zvukoveho
interpretu anglictiny prinasi mnoho zakazniku, zatimco interpret ceske
vyslovnosti mnoho penez neprinese. Vetsina podpory narodnich jazyku vdeci za
svuj vznik Japoncum, Cinanum, Indum, jejichz trh je tak perspektivni, ze se
tam kazdy snazi proniknout. Trh ovladany cestinou je maly, Slovaci maji
jeste vetsi smulu.
5) Pokud selze trh, musi si male narody pomoci s vlastni jazykovou kulturou
sami. Zatimco napr. Japonci pokladaji praci v narodnim prostredi za
samozrejmost v plnem souladu s mezinarodnim spolecenstvim, Cesi si vymysli
"kody Kamenickych" a jinych "narodnich specifik" podrezavaji vlastni vetev.
I zde je na jedne strane pruznost, na druhe ucta k narodni tradici,
potrebnou devizou. My ovsem, misto toho abychom resili zakladni problemy
narodni a jazykove kultury, resime pseudoproblemy homosexualu a fetaku.
Pamatuji se na jeden Invex, kde zahranicni firma vystavovala
kopretinovou tiskarnu vcetne ovladace, ktery umoznoval soutiskem nekolika
znaku tisknout i texty v nemcine. Protimni cesti odbornici zasli a tvrdili,
ze v cestine by to asi neslo, zatimco pritomny expert behem veletrhu dokazal
upravit ovladac i pro cestinu. Pravda, napr. pismeno s hackem se tisklo na
trikrat - pismeno, carka a obracena carka, ale pracovalo to. Osobne jsem si
postupne doplnil DOSovy WordPerfect o cesky slovnik pro deleni a testovani
pravopisu - vyzadovalo to asi rok sbirat nova slova a cas od casu je do
slovniku doplnit - ale chodilo to, jini skeptici tvrdili, ze pro slozitou
cestinu to neni mozne. Jak rikaji Anglicane, kde je vule, tam je i cesta.
Poznámka TP: Češi jsou v tom, že existuje tolik kódování češtiny, nevinně. Jediným domácím kódem pro PC, který J. Šoler zmiňuje, je kódování MJK, neboli kód bratří Kamenických; ten se ale rozšířil před všemi ostatními systémy, a tak nelze jeho autory vinit z nerespektování standardů. Naopak, jejich volba pozic pro české znaky byla vhodnější, než první standard, s nímž přišel Microsoft, tj. kódová stránka Latin 2 (CP-852) - tam jsou znaky s diakritikou umístěny na pozicích semigrafiky a mnohé programy, pracující v tomto režimu, tak vypadají v "kamenících" lépe než v "latině".
Ani další diskrepanci nezavinil nikdo z Čechů: Windows přišly se zcela novým kódováním češtiny (CP-1250), které se lišilo jako od MJK, tak od CP-852 a nerespektovalo dokonce ani už tehdy existující ISO normu 8859-2, běžnou na unixových systémech.
Moderní Windows tak pracují dokonce se čtyřmi různými kódováními češtiny současně. Počítejte se mnou: v DOSovém okně nalezneme CP-852, ve Windows se texty ukládají volitelně v CP-1250 nebo v Unicode (UTF-8), webový prohlížeč a e-mail používají jako standard kód ISO-8859-2 a True Type fonty jsou pouze unicodové.
Ano, je to nepředstavitelný chaos, ale určitě ho nezpůsobil nikdo z Čechů. Spíš bych hledal viníka západněji, v okolí Seattlu...