ekezetek
VF
vf at elte.hu
Thu Feb 26 07:40:44 CET 2004
Thus spake hwsw famulus <hwsw at famulus.hu>:
> Miért is nem mindegy, hogy az Õ-t
> á O textként vagy 2/3/4 byte-ként jelöljük?
Azert, mert az eredeti html szabvany, mint mar vagy 3x leirtam,
visszafele kompatibilis. Ha olyan ekezettel talalkozik a browser,
melyet nem tamogat, az ismeretlen taget figyelmen kivul kell
hagynia. Igy a szoveg mindig olvashato, legfeljebb bizonyos
ekezetek hianyozni fognak.
Az UTF kodolassal minimum az ekezetes betuk teljesen olvashatatlanokka
valnak.
De a baj meg nagyobb, mint gondolnad!
Nem csak a programokra kell felkeszulni, hanem az internet eddigi
tortenelme soran felhalmozott sok gigabajt anyagra is.
Az mind codepage, vagy sima ASCII formatumban van.
Ketteszakad a vilag, ahogy Gumo irta, a regi formatumban keszult
anyagok elerhetetlenekke valnak az uj programok szamara, es forditva.
Minden progmatos tudja, hogy az adatok program-fuggetlensege
ugyanannyira fontos, mint a programok gep-fuggetlensege.
Ezt az alapelvet sertik meg, es felesleges inkompatibilitasi
problemakkal terhelnek egy nemzetkozi halozatot, melynek legerdekesebb
tulajdonsaga a platform es programfuggetlenseg volt. Volt!
Az ilyen reformokat ugy kene bevezetni, hogy definialnak egy uj mail-
protokolt, mely kikuszoboli az SMTP tobbi hibajat is, es definialjak
hogy a szoveg tarolasa unicode formaban tortenik. Ez lenne a kulturalt
eljaras, egy szavam sem lenne ellene, nem okozna semmi problemat.
Ahogy a word is attert az unicode-ra, teljesen eszrevetlenul.
Egy zart formatum eseten nem problema.
Ha viszont ilyen modon inkompatibilisek leszunk a vilag masik felevel,
gaz, ennyit nem er az egesz.
Az UTF egyesiti a ket modszer hatranyat: ugyanolyan gany es szar marad
a rendszer, de legalabb elveszitjuk a kompatibilitast is!
> Szóval akkora technika/metodikai különbség nincs...
Nincs. Az unicode tok jo, csak emailben nem kene eroltetni.
> csak az egyik eljárás lehet tökéletes is (unicode)
> a másik meg elvben sem...ill. ha
A masik modszer elonyei:
Html: visszafele kompatibilitas. Ha nincs ekezetes fontunk, a browser
akar grafikusan meg tudja csinalni, ha nem ismeri azt az ekezetet,
vagy nem tud grafikusan csinalni, olvashato ektelen karakter marad
helyette, nem zavarja ossze a szoveget.
Codepage: tomorebb, egy char mindig egy byte.
Mindketto hatranya: egy szovegben csak egyfajta specialis ekezetekkel
rendelkezo nyelv mukodik tokeletesen. De tegyuk hozza, hogy a hibak
altalaban minimalisak, pl a magyar nyelvbol osszesen a dupla hosszu
ekezetek hianyoznak, helyettuk kalapos/hullamos van. A tobbi alap
ekezet standard ASCII!
> Mert nem írsz naponta vegyes szövegeket, azaz
> nem fordítasz pl. gépkönyvet vagy nem vagy könytáros
> stb, sok eset van amikor kell a vegyes nyelvû szöveg
Tudomasul kell venni, hogy emailben, SMS-ben ez nem megy, es kesz.
Doc, pdf, rtf, ps stb.. tamogatja.
Tehat dolgozni tudsz, ha el akarod kuldeni emailben, hasznalod
valamelyik fenti formatumot, es attacholod.
Weblapra kirakhatod kepkent is, a kepleteket amugy is mindig ugy
csinaljak, sot a csicsas lapokon a sima szoveget is.
> Amíg csak belterjesen magyarban gondolkodsz nem sok
> elõny látszik, de kérdezz a lengyel kollegátol valamit
> pl. egy prosiban látott lengyel kifejezés magyarázatát...
> Hogy fogod beleírni a közös angol munkanyelven írt levélbe
> az eredeti lengyel szót! amire kiváncsi vagy, hogy
> jól fordíthasd magyarra.
Pl repulo ekezetekkel, ha azok nelkul a szoveg felreertheto lenne.
Ha nem, nem vacakolnek az ekezetekkel egyaltalan.
Mire jo?
Tudomasul kell venni, hogy az email ilyen.
A magyar nyelv szavain es betuin sem gondolkodunk el, hogy lehetne
mashogy mondani, rajzolni, es az sokkal szebb/logikusabb lenne.
> KJ
--
Valenta Ferenc <vf at elte.hu> Visit me at http://ludens.elte.h u/~vf/
"My love is REAL, unless declared INTEGER."
____________________________________________________________________
Miert fizetsz az internetert? Korlatlan, ingyenes internet hozzaferes a FreeStarttol.
Probald ki most! http://www.freestart.hu
More information about the Elektro
mailing list