[eside-ghost] python unicode harakiri
STenyaK
stenyak en gmail.com
Mie Mar 2 12:04:52 CET 2011
Si te echan una ristra de bits y no dicen qué es, estás un poco fuckeado.
Igual existen heurÃsticas para averiguar el encoding (en plan, analisis de
frecuencias de letras o cosas asin), o igual puedes averiguar de donde viene
el texto (si es un nombre de fichero, y estas en el sistema operativo X, y
el SO está instalado en el idioma Y, pos tiene boletos de ser el encoding
Z).
2011/3/2 Yuki (aka Rubén Gómez) <rugoli en gmail.com>
> 2011/3/2 Saúl Ibarra Corretgé <saghul en gmail.com>:
> > Aupa!
> >
> > Lo pasamos a unicode:
> >
> > u = s_8859.decode('iso8859-1')
> >
> > Ahora ya lo podemos encodear como queramos:
> >
> > s = u.encode('utf-8')
> Y si no sabemos cómo nos viene el string? Es decir, si nos viene un
> string a veces en utf pero otras veces en iso8859-1 y otras veces en
> otro encoding?
>
> Pregunto porque el otro dÃa también me pasó lo mismo con un plugin de
> XBMC. El plugin este sirve para ver las listas de reproducción de
> Youtube en el XBMC, y tenÃa una lista con una tilde ("VÃdeos)" y
> cuando quité "Ã" funcionó.
> _______________________________________________
> eside-ghost mailing list
> eside-ghost en listas.deusto.es
> https://listas.deusto.es/mailman/listinfo/eside-ghost
>
--
Saludos,
Bruno González
_______________________________________________
Jabber: stenyak AT gmail.com
http://www.stenyak.com
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: https://listas.deusto.es/mailman/private/eside-ghost/attachments/20110302/60181fb2/attachment.htm
Más información sobre la lista de distribución eside-ghost