¿Qué es UTF-8?

¿Qué es UTF-8?

publicado en: Diseño web | 8

En este artículo vamos a arrojar un poco de luz sobre esa etiqueta que debemos poner en nuestras webs, <meta charset=»utf-8″>, y que quizás no sepamos muy bien de que se trata.

Pero para hablar de UTF- 8 primero tenemos que hablar de Unicode.

Estándar Unicode

A continuación leemos la definición de Unicode que nos proporciona su propio creador, el Consorcio Unicode.

El estándar Unicode es un sistema de codificación de caracteres diseñado para soportar el intercambio, procesamiento y visualización universal de los textos escritos en los diversos lenguajes y disciplinas técnicas del mundo moderno. Además, es compatible con los textos clásicos e históricos de muchos idiomas escritos. (unicode.org)

El método con el que trabajan los ordenadores para representar un determinado carácter es a través de los números. Es decir, cuando el ordenador tiene que representar un carácter concreto, por ejemplo la “a” del alfabeto latino, lo busca entre todos los caracteres que tiene almacenados identificándolo por el número que tiene asignado.

Unicode proporciona un número único a cada carácter independientemente de la plataforma, el programa o el idioma. Esto hace que bajo este estándar se agrupen más de 120.000 caracteres, todos ellos codificados para que un ordenador pueda utilizarlos en cualquier programa y sistema operativo.

Veamos un ejemplo:

Ejemplo unicode

UTF-8

Como hemos dicho anteriormente, cada carácter es identificado por un número, pero para que ese número o código sea entendido por el ordenador debe estar codificado, es decir traducido a binario de un modo específico.

Unicode utiliza diferentes formas de codificación, entre ellas UTF-8. UTF corresponde a las siglas de “Formato de Transformación Unicode” (en inglés), y el número 8 a los bits. Este formato es considerado el más idóneo para web y e-mail.

Este formato de codificación permite codificar cualquiera de los miles de caracteres Unicode.

Resumiendo, Unicode agrupa y numera a más de 120.000 caracteres (set de caracteres) y UTF-8 se encarga de codificar los números y hacerlos accesibles para los ordenadores.

Aquí dejo el siguiente enlace donde podrás conseguir rápida y cómodamente el código de cualquier carácter Unicode.

.

Captura web unicode-table
Detalle de unicode-table.com

Como verás también nos dan la forma de cómo escribir el número del carácter para código HTML. Veamos el ejemplo para mostrar el signo del yen.

<p>Este es el signo del yen: &#165;</p>

Etiqueta charset

Por lo tanto cuando se coloca la etiqueta <meta charset=»utf-8″> estamos informando al navegador cual es la codificación del set de caracteres utilizada en el documento.

Es muy recomendable utilizar dicha etiqueta, ya que cuando no se especifica ninguna codificación el navegador utilizará la codificación que tenga configurada el usuario, pudiendo esto provocar errores a la hora de mostrar la página.

Aunque existen otras codificaciones además de UTF-8 que se pueden utilizar, ésta es recomendable ya que su extendido uso aumenta las posibilidades de que el navegador la entienda.

Share on LinkedInShare on FacebookShare on Google+Tweet about this on Twitter

8 Respuestas

  1. Enrique Rivas Viniegra

    Muchas gracias por el artículo. Muy interesante. Solamente una observación por si te puede ayudar. En el penúltimo párrafo hay una frase donde creo te falta alguna palabra.

    «pudiendo esto provocar a la hora de mostrar la página.» quizás pueda ser «errores», «confusiones» o algo por el estilo.

    • Javier Pérez de Arrilucea

      Hola Enrique, gracias por tus palabras y por el aviso, lo corrijo de inmediato.
      Un saludo

  2. Hola, como puedo transformar un texto con la codificación explicada a un texto en español latino? Sería de mucha ayuda su respuesta

    Gracias

    • Javier Pérez de Arrilucea

      Hola Carola, no entiendo exactamente tu pregunta, necesitaría más información sobre el problema para poder ayudarte.

  3. muy buena explicación

    • Javier Pérez de Arrilucea

      Hola Carlos, muchas gracias por tu comentario.
      Un saludo

  4. Solucionaste una de mis dudas muchas gracias

Dejar una opinión