[eside-ghost] diferencias entre iso y utf
Álvaro Uría (Fermat)
fermat en movimage.com
Mar Jun 8 17:08:57 CEST 2004
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
Aupa aKtoR,
El Tue, 8 Jun 2004 11:00:53 +0200,
aKtoR escribió:
// Aupi,
//
// Ultimamente me rondan varias dudas sobre los juegos de caracteres
// (charset).
//
// No hace demasiado tiempo y como sustitución a los juegos de caracteres
// tradicionales, obsoletos e insuficientes aparecieron los nuevos juegos
// UTF.
//
// Mi duda es si alguien puesto en el tema puede explicar de forma un poco
// más clara las principales diferencias entre los juegos de caracteres,
// cuando interesa utilizar unos u otros y hacia que se debe tender...
//
Lo primero.. yo no estoy nada puesto en el tema. Es más, los charset me
suenan solamente al tema de WEB y la W3C, y no al tema en el que preguntas,
de las locales.
En el caso de WEB, cuando tengo dudas suelo ir directamente al sitio de la
W3C, en la que explican *todo* de pm, e incluso te dicen que recomiendan el
utf-8, que es más internacional.
En el RFC de 'text/html' dicen:
>>>>>>>>
http://rfc.net/rfc2854.html
charset
The optional parameter "charset" refers to the character
encoding used to represent the HTML document as a sequence of
bytes. Any registered IANA charset may be used, but UTF-8 is
preferred. Although this parameter is optional, it is strongly
recommended that it always be present. See Section 6 below for
a discussion of charset default rules.
<<<<<<<<
// Lo que tengo más o menos claro (o confuso xD) es lo siguiente:
//
// - tenemos iso-8859-1, que es el juego de caracteres de Latin 1, el
// que usamos en europa occidental para representar casi todos los caracteres.
// - Ademas el iso-8859-1 es el que se usa como codificación del gran parte
// de los contenidos HTML y XHTML.
// - Nos hicimos europeos y llegó el euro, apareciendo el juego de
// caracteres iso-8859-15 que soportaba el símbolo que muchos no podemos
// ver en nuestros mua's. €
// - Por último, como deficiencia a nuevos símbolos y como estandar a los
// diferentes juegos de caracteres existentes por el mundo aparecieron
// los UTF. UTF-8 y UTF-16.
// - Estos últimos también estan soportados por la codificación empleada
// para los navegadores web.
//
Mírate esta página:
http://docs.cogix.com/vf38/docs/Internationalization.html
// Ahora mis preguntas xD:
Intentaré responder pero basándome en lo que sé de charset en web O:)
// - ¿Cual es el que debo configurar en linux en las locales?
Si el UTF-8 es más internacional, quizás ese.
// - ¿Cual es el que debo configurar en linux en el kernel?
Eeeeel.. ¿utf-8? En el enlace de antes dice que sirve para todos los
lenguajes, aunque iso-8859-1 se usa en todo europa occidental y ee.uu.,
pero el utf-8 es posterior a ese charset.
// - ¿Conviene definir varios charset en las locales?
No te sé responder. ¿En el /etc/locale.alias ya hay varios definidos no?
// - ¿Cual es el que debo configurar en editores de texto tipo 'gedit' al
// salvar un documento de texto?
¿utf-8?
// - ¿Cual es el que debo utilizar al enviar mails?
Yo uso iso-8859-1, pero quizás debería usar utf-8.
// - ¿Cual es el que debo utilizar en los documentos html y xhtml para que
// llegue a más gente?
¡utf-8! este sí ;DD
// - ¿Cual es el que debo utilizar en los documentos html y xhtml para que
// sea más estandar?
ISO* de por sí es un standard, pero la W3C está avanzando y recomendando
UTF.
// - ¿Cual es el que debo utilizar en los documentos html y xhtml para que
// se adapte a los nuevos cambios/estandares?
utf-8
// - ¿Ventajas y desvenajas de cada uno?
Western Europe: English, French, Dutch, German, Spanish, Catalan, Basque,
Portuguese, Italian, Albanian, Rhaeto-Romanic, Danish, Swedish, Norwegian,
Finnish, Faroese, Icelandic, Irish, Scottish, Afrikaans and Swahili. <>
ISO-8859-1 (Latin1)
Unicode (all languages) <> UTF-8
Multiple languages in same survey <> UTF-8
// saludos
Saludos!
PD: no estoy muy seguro de haber ayudado mucho O:)
- --
,--.
| oo| wget -O - fermat.movimage.com/fermat.asc | gpg --import
| ~~| Key FingerPrint = 02C3 E5E5 2283 D08F 506C 3070 4713 40EF 21C5 21E2
|/\/\|
|_[#] El electrón es el verdadero héroe de nuestro siglo.
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.4 (GNU/Linux)
iD8DBQFAxdaJRxNA7yHFIeIRArqsAJ9JFdvwHm+sbSu3S5LKtDDlO6H7aQCfU3g/
n+fbzPMEdaM7b3xF8kscOdM=
=hDyk
-----END PGP SIGNATURE-----
Más información sobre la lista de distribución eside-ghost