ekezetek

VF vf at elte.hu
Thu Feb 26 07:40:44 CET 2004


Thus spake hwsw famulus <hwsw at famulus.hu>:

> Miért is nem mindegy, hogy az Õ-t 
> &aacute O textként vagy 2/3/4 byte-ként jelöljük?

Azert, mert az eredeti html szabvany, mint mar vagy 3x leirtam,
visszafele kompatibilis. Ha olyan ekezettel talalkozik a browser,
melyet nem tamogat, az ismeretlen taget figyelmen kivul kell
hagynia. Igy a szoveg mindig olvashato, legfeljebb bizonyos
ekezetek hianyozni fognak.
Az UTF kodolassal minimum az ekezetes betuk teljesen olvashatatlanokka
valnak.
De a baj meg nagyobb, mint gondolnad!
Nem csak a programokra kell felkeszulni, hanem az internet eddigi
tortenelme soran felhalmozott sok gigabajt anyagra is.
Az mind codepage, vagy sima ASCII formatumban van.
Ketteszakad a vilag, ahogy Gumo irta, a regi formatumban keszult
anyagok elerhetetlenekke valnak az uj programok szamara, es forditva.
Minden progmatos tudja, hogy az adatok program-fuggetlensege
ugyanannyira fontos, mint a programok gep-fuggetlensege.
Ezt az alapelvet sertik meg, es felesleges inkompatibilitasi
problemakkal terhelnek egy nemzetkozi halozatot, melynek legerdekesebb
tulajdonsaga a platform es programfuggetlenseg volt. Volt!

Az ilyen reformokat ugy kene bevezetni, hogy definialnak egy uj mail-
protokolt, mely kikuszoboli az SMTP tobbi hibajat is, es definialjak
hogy a szoveg tarolasa unicode formaban tortenik. Ez lenne a kulturalt
eljaras, egy szavam sem lenne ellene, nem okozna semmi problemat.
Ahogy a word is attert az unicode-ra, teljesen eszrevetlenul.
Egy zart formatum eseten nem problema.
Ha viszont ilyen modon inkompatibilisek leszunk a vilag masik felevel,
gaz, ennyit nem er az egesz.
Az UTF egyesiti a ket modszer hatranyat: ugyanolyan gany es szar marad
a rendszer, de legalabb elveszitjuk a kompatibilitast is!

> Szóval akkora technika/metodikai különbség nincs...

Nincs. Az unicode tok jo, csak emailben nem kene eroltetni.

> csak az egyik eljárás lehet tökéletes is (unicode)
> a másik meg elvben sem...ill. ha

A masik modszer elonyei:
Html: visszafele kompatibilitas. Ha nincs ekezetes fontunk, a browser
akar grafikusan meg tudja csinalni, ha nem ismeri azt az ekezetet,
vagy nem tud grafikusan csinalni, olvashato ektelen karakter marad
helyette, nem zavarja ossze a szoveget.
Codepage: tomorebb, egy char mindig egy byte.

Mindketto hatranya: egy szovegben csak egyfajta specialis ekezetekkel
rendelkezo nyelv mukodik tokeletesen. De tegyuk hozza, hogy a hibak
altalaban minimalisak, pl a magyar nyelvbol osszesen a dupla hosszu
ekezetek hianyoznak, helyettuk kalapos/hullamos van. A tobbi alap
ekezet standard ASCII!

> Mert nem írsz naponta vegyes szövegeket, azaz
> nem fordítasz pl. gépkönyvet  vagy nem vagy könytáros
> stb, sok eset van amikor kell a vegyes nyelvû szöveg

Tudomasul kell venni, hogy emailben, SMS-ben ez nem megy, es kesz.
Doc, pdf, rtf, ps stb.. tamogatja.
Tehat dolgozni tudsz, ha el akarod kuldeni emailben, hasznalod
valamelyik fenti formatumot, es attacholod.
Weblapra kirakhatod kepkent is, a kepleteket amugy is mindig ugy
csinaljak, sot a csicsas lapokon a sima szoveget is.

> Amíg csak belterjesen magyarban gondolkodsz nem sok
> elõny látszik, de kérdezz a lengyel kollegátol valamit 
> pl. egy prosiban látott lengyel kifejezés magyarázatát...
> Hogy fogod beleírni a közös angol munkanyelven írt levélbe
> az eredeti lengyel szót! amire kiváncsi vagy, hogy
> jól fordíthasd magyarra.

Pl repulo ekezetekkel, ha azok nelkul a szoveg felreertheto lenne.
Ha nem, nem vacakolnek az ekezetekkel egyaltalan.
Mire jo?
Tudomasul kell venni, hogy az email ilyen.
A magyar nyelv szavain es betuin sem gondolkodunk el, hogy lehetne
mashogy mondani, rajzolni, es az sokkal szebb/logikusabb lenne.

> KJ

-- 
Valenta Ferenc <vf at elte.hu>   Visit me at http://ludens.elte.h u/~vf/
"My love is REAL, unless declared INTEGER."


____________________________________________________________________
Miert fizetsz az internetert? Korlatlan, ingyenes internet hozzaferes a FreeStarttol.
Probald ki most! http://www.freestart.hu



More information about the Elektro mailing list