Mecanismos de codificación
Codificación
de caracteres
ASCII (American
Standard Code for Information Interchange)
Es
un código para la representación de caracteres, de manera que un carácter se
representa con 7 bits. Los primeros 32 caracteres son caracteres de control no
imprimibles que actualmente están obsoletos, como por ejemplo, el código 10,
que hacía que la impresora saltara a la siguiente línea.
Latin-1
Los
caracteres ASCII son los del alfabeto inglés y, por tanto, no permite caracteres con acentos o
la letra ñ. para remediar estos problemas, se crearon códigos ASCII extendidos de 8 bits, que eran idénticos al código
ASCII hasta el carácter 127, y en los siguientes caracteres hasta el 255 se incluían
otros caracteres como vocales acentuadas, el símbolo de inicio de interrogación
(¿) entre otros.
Latin-1
o ISO 8859-1 es un estándar ASCII extendido que contiene los caracteres alfabéticos
de Europa occidental, como todas las lenguas oficiales del estado español, el francés,
el portugués y otros.
ISO
8859-1
En
1992, la IANA estandarizo una codificación de 8 bits, basado en ISO 8859-1,
llamada ISO-8859-1:1987 o ISO-8859-1 para la codificación del texto enviado por
internet.
Unicode
(código universal)
Proporciona
un método estándar para representar y manipular caracteres en soportes informáticos.
La vrsion actual codifica más de 100.000 caracteres.
UTF-8 (Unicode Transformation Format). Es
una parte del estándar Unicode compatible con ASCII. Cada carácter representado
por una secuencia de 1 a 4 octetos, de manera que incluye alfabeto latino,
griego, hebreo…
IETF (Internet Engineering Task Force). es
una parte del estándar de la codificación UTF-8 debe estar soportada por todos
los protocolos de internet. Actualmente, se tiende a tener todas las
aplicaciones y bases de datos con la información codificada con formato UTF-8
Los
sistemas de codificación
La
codificación se puede definir como la asignación de símbolos mediante un plan sistemático,
para distinguir ciertos fenómenos y establecer su ordenamiento dentro de una clasificación
determinada.
La
necesidad de clasificación surge en la necesidad de registrar, enmascarar, ordenar,
identificar, agrupar y clasificar fenómenos y para facilitar su registro y transmisión.
El
objetivo general de un código es el de identificar un fenómeno o elemento o
relacionarlo con un grupo determinado, en forma tal que las partidas
codificadas puedan ser decodificadas tan eficientemente como sea posible por
medio de un índice o guía. El código suministra un sustituto para el nombre o
valor normal de la partida codificada., el cual desde el punto de vista de la información
consiste en un conjuto irrelevante de caracteres.
Objetivos
de los códigos:
·
Facilitar
el procesamiento.
·
Permitir identificación inequívoca.
·
Permitir
clasificación.
·
Permitir
recuperación o localización de información.
·
Posibilitar
establecimiento de relaciones entre diferentes elementos codificados.
·
Facilitar
el señalamiento de propiedades particulares de los elementos codificados.
Características
de los sistemas de códigos:
·
Debe
estar adaptado lógicamente al sistema informativo de que forme parte.
·
Debe
mantenerse tan reducido como pueda.
·
Debe
tener precisión, necesario para describir un dato.
·
Debe
permitir expansión.
·
Debe
ser fácil de usar.
·
Debe
ajustarse los requerimientos de los
equipos.
Existen
dos tipos básicos de sistemas de códigos significativos y los no
significativos.
Significativos:
como su nombre lo indica son aquellos que implican un significado, es decir, que
reflejan en un mayor o menor grado las características del objeto, partida o individuo
a los cuales se asigna.
No
significativos: de ninguna manera describen
el objeto a que se les aplica sino que son simples etiquetas por medio
de las cuales se distinguen de otros el objeto.
Existe
una gran variedad de métodos de codificación, los cuales se clasifican de
acuerdo a los símbolos que usan
·
Numéricos.
·
Alfabéticos.
·
Alfanuméricos.
En
sentido general los códigos alfabéticos y alfanuméricos son efectivos cuando se
trata de codificaciones simples, sin muchas clasificaciones y con una cantidad
reducida de partidas. Tiene la desventaja que la cantidad limitada de letras no
permite mucha amplitud en las clasificaciones, aunque con un carácter alfabético
se pueden clasificar 26 posibilidades, lo que puede permitir reducir el tamaño
de un código.
Los
códigos numéricos se emplean con mayor profusión, por su versatilidad y amplias
posibilidades para el empleo de equipos de procesamiento. Tienen la desventaja
de que pueden ser difíciles de interpretar por el personal que los maneja,
especialmente si consta de gran cantidad de caracteres.
No hay comentarios:
Publicar un comentario