Enetendiendo un poco sobre qué es UTF-8 y para qué sirve.

ASCIILa verdad que éste es un tema que me viene carcomiendo la cabeza desde hace ya varios meses, pero después de haber leído lo siguiente me atrevo a decir que el volumen de "la laguna" que tenía ha disminuído considerablemente.

No me voy a poner a transcribir lo que leí pero sí voy a dejar enlaces para todo aquel que esté interesado en entender de qué va UTF-8 y qué son todas esa siglas que van desde ASCII, ANSI, ISO 8859, UCS hasta vaya uno a saber dónde.

Este asunto me resultaba dificil de entender porque yo me inicié en el tema de la informática a fines de 1999 después de abandonar primer año de veterinaria (¿?).

Si bien en casa teníamos PC desde varios años antes, nunca me animé a tocar demasiado por miedo a hacer estragos ... a romper. El hecho de que tuviésemos PC no implicaba que los servicios técnicos sean económicos, y como mis viejos la usaban para trabajar, romper esa caja pálida, o peor, borrar sus datos, podía suponer una fractura de rodillas :P.

A los doce años empecé mi primer frustrado curso de informática en el I.S.E.C. (Instituto Superior de Enseñanza en Computación).

Por qué frustrado se preguntarán, ¿no?... bueno, lo cuento igual ;). Frustrado porque como muchos institutos tenían divididos los temarios por edades y en vez de tocarme la parte linda (en la que yo me quería iniciar: D.O.S., programación, etc.), me mandaron a hacer dibujitos con una tortuguita en Logo :S. Un par de meses depués, luego de varias horas de penitencia :S, decidí alejarme del tema.

Después, cuando dejé veterinaria (18 años), tenía que hacer algo y fue ahi en donde empezé a inclinarme a este maravilloso y apasionante mundo :). La historia es más larga, pero la cuento otro día :P.

Entonces si bien tenía una vaga idea de lo que es el código ASCII, cada vez que me atrevía a asomar la cabeza en el tema de Unicode terminaba ahogado de conceptos, siglas, bits, bytes y cosas que no me terminaban de cerrar.

Ayer, debido a un problema que tuvo JEL en su blog, volvió a sacudirme duro el tema de Unicode y dejarme sin respuestas. Digo volvió porque no es la primera vez que este tema me hace bajar los brazos. Además de este asunto, estoy trabajando con las funciones de la librería CURL (libCurl) en PHP y me sigo encontrando y chocando con funciones como urlencode() y envío de datos a través de formularios por el método POST, codificacion de caracteres y un oscuro etcétera (no tan oscuro ahora).

Fue de esta manera que tomé las riendas sobre este tema nuevamente y terminé después de dar un par de saltos en la Wikipedia. Confiezo que los artículos que leí están en español, no es que eso sea malo, pero todos sabemos que, por lo general, en inglés la documentación es muchísimo más completa. Traducir algo que leía y sin estar seguro de qué es lo realmente leía me embarraba más la dificultad de comprensión.

A continuación dejo los links en el orden en que los fui leyendo. Pongo énfasis justamente en el orden porque es de esta manera que me resultó más fácil comprenderlo y aclaro que no se van a volver unos expertos en el tema, pero considero que es una muy buena introducción.

Empezando a entender Unicode y UTF-8:

  1. ASCII
  2. Unicode
  3. Codificación de caracteres
  4. UTF-8
  5. The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!) - En inglés

Hay un millón de links en el medio que a muchos les puede llegar a servir o interesar (esto va para los melancólicos) aunque traten de no irse por las ramas hasta no terminar de leer cada artículo. Si bien en algunos momentos se pone tedioso o confuso, la idea es no parar hasta el final.

Creo que no está demás agradecer a todos aquellos que se tomaron su buen tiempo en escribir/traducir los contenidos de estos temas. Gracias a ellos, me fue de muchísima ayuda.

The end.

Comentarios:

No se ha cargado ningún comentario.