[eside-ghost] diferencias entre iso y utf

Álvaro Uría (Fermat) fermat en movimage.com
Mar Jun 8 17:08:57 CEST 2004


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Aupa aKtoR,

El Tue, 8 Jun 2004 11:00:53 +0200,
aKtoR escribió:

// Aupi,
// 
// Ultimamente me rondan varias dudas sobre los juegos de caracteres
// (charset).
// 
// No hace demasiado tiempo y como sustitución a los juegos de caracteres
// tradicionales, obsoletos e insuficientes aparecieron los nuevos juegos
// UTF.
// 
// Mi duda es si alguien puesto en el tema puede explicar de forma un poco
// más clara las principales diferencias entre los juegos de caracteres,
// cuando interesa utilizar unos u otros y hacia que se debe tender...
// 

Lo primero.. yo no estoy nada puesto en el tema. Es más, los charset me
suenan solamente al tema de WEB y la W3C, y no al tema en el que preguntas,
de las locales.

En el caso de WEB, cuando tengo dudas suelo ir directamente al sitio de la
W3C, en la que explican *todo* de pm, e incluso te dicen que recomiendan el
utf-8, que es más internacional.

En el RFC de 'text/html' dicen:
>>>>>>>>
http://rfc.net/rfc2854.html
      charset
         The optional parameter "charset" refers to the character
         encoding used to represent the HTML document as a sequence of
         bytes. Any registered IANA charset may be used, but UTF-8 is
         preferred.  Although this parameter is optional, it is strongly
         recommended that it always be present. See Section 6 below for
         a discussion of charset default rules.
<<<<<<<<


// Lo que tengo más o menos claro (o confuso xD) es lo siguiente:
// 
// - tenemos iso-8859-1, que es el juego de caracteres de Latin 1, el
//   que usamos en europa occidental para representar casi todos los caracteres.
// - Ademas el iso-8859-1 es el que se usa como codificación del gran parte
//   de los contenidos HTML y XHTML.
// - Nos hicimos europeos y llegó el euro, apareciendo el juego de
//   caracteres iso-8859-15 que soportaba el símbolo que muchos no podemos
// ver en nuestros mua's. €
// - Por último, como deficiencia a nuevos símbolos y como estandar a los
//   diferentes juegos de caracteres existentes por el mundo aparecieron
// los UTF. UTF-8 y UTF-16.
// - Estos últimos también estan soportados por la codificación empleada
//   para los navegadores web.
// 

Mírate esta página:
	http://docs.cogix.com/vf38/docs/Internationalization.html


// Ahora mis preguntas xD:

Intentaré responder pero basándome en lo que sé de charset en web O:)

// - ¿Cual es el que debo configurar en linux en las locales?

Si el UTF-8 es más internacional, quizás ese.

// - ¿Cual es el que debo configurar en linux en el kernel?

Eeeeel.. ¿utf-8? En el enlace de antes dice que sirve para todos los
lenguajes, aunque iso-8859-1 se usa en todo europa occidental y ee.uu.,
pero el utf-8 es posterior a ese charset.

// - ¿Conviene definir varios charset en las locales?

No te sé responder. ¿En el /etc/locale.alias ya hay varios definidos no?

// - ¿Cual es el que debo configurar en editores de texto tipo 'gedit' al
//   salvar un documento de texto?

¿utf-8?

// - ¿Cual es el que debo utilizar al enviar mails?

Yo uso iso-8859-1, pero quizás debería usar utf-8.

// - ¿Cual es el que debo utilizar en los documentos html y xhtml para que
//   llegue a más gente?

¡utf-8! este sí ;DD

// - ¿Cual es el que debo utilizar en los documentos html y xhtml para que
//   sea más estandar?

ISO* de por sí es un standard, pero la W3C está avanzando y recomendando
UTF.

// - ¿Cual es el que debo utilizar en los documentos html y xhtml para que
//   se adapte a los nuevos cambios/estandares?

utf-8


// - ¿Ventajas y desvenajas de cada uno?

Western Europe: English, French, Dutch, German, Spanish, Catalan, Basque,
Portuguese, Italian, Albanian, Rhaeto-Romanic, Danish, Swedish, Norwegian,
Finnish, Faroese, Icelandic, Irish, Scottish, Afrikaans and Swahili. <>
ISO-8859-1 (Latin1)

Unicode (all languages) <> UTF-8
Multiple languages in same survey <> UTF-8


// saludos

Saludos!

PD: no estoy muy seguro de haber ayudado mucho O:)
- -- 
  ,--.
 |  oo| wget -O - fermat.movimage.com/fermat.asc | gpg --import
 |  ~~| Key FingerPrint = 02C3 E5E5 2283 D08F 506C  3070 4713 40EF 21C5 21E2
 |/\/\|
     |_[#] El electrón es el verdadero héroe de nuestro siglo.

-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.4 (GNU/Linux)

iD8DBQFAxdaJRxNA7yHFIeIRArqsAJ9JFdvwHm+sbSu3S5LKtDDlO6H7aQCfU3g/
n+fbzPMEdaM7b3xF8kscOdM=
=hDyk
-----END PGP SIGNATURE-----


Más información sobre la lista de distribución eside-ghost