Webinar
ITGLOBAL.COM events
Compresión de Datos

Compresión de datos significa la transformación de la información que se realiza para reducir su volumen. Se utiliza para garantizar el uso racional de los recursos de hardware que almacenan, procesan, transmiten y realizan cualquier otra operación con información.

Compresión de datos en el almacenamiento de NetApp


más información

El proceso de compresión de datos se basa en la eliminación de la redundancia, característica de los datos intactos (sin comprimir). El ejemplo más simple de redundancia de información son demasiadas repeticiones de la misma palabra en el texto.

Para eliminar este tipo de redundancia, debe reemplazar una palabra que aparece con frecuencia con un enlace a otro dato que esté codificado y tenga un volumen estrictamente especificado.

Se puede lograr reducir el “peso” de los datos reemplazando las palabras codificadas con tipos de datos repetidos con demasiada frecuencia y códigos largos de datos demasiado raros (codificación por entropía). Si los datos no tienen redundancia (información encriptada, “ruido blanco”, señal corta, etc.), entonces no será posible comprimirlos sin perder información.

La compresión de datos sin pérdidas es un proceso que permite, si es necesario, restaurar completamente la información original, porque el volumen de información almacenada no disminuye, a pesar de la disminución del espacio que ocupa.

La posibilidad anterior puede aparecer si las probabilidades se distribuyen de manera desigual en los mensajes. Por ejemplo, cuando algunos de los mensajes que son posibles en teoría no ocurrieron en la codificación temprana de estos mensajes.

Algoritmos de compresión de datos para tipos de datos desconocidos

Hay 2 métodos principales de compresión de datos que tienen un formato desconocido:

  1. Cada carácter comprimido sucesivo se coloca en el búfer de salida en su forma original, o se reemplaza un grupo de varios caracteres comprimidos por una referencia a un grupo similar de caracteres codificados. Este método se usa con mayor frecuencia al crear software autoextraíble.
  2. Las estadísticas (frecuencia de aparición de datos en el código) se recopilan una vez o continuamente para cada secuencia de caracteres que se comprimen. En base a estas estadísticas, se determina la probabilidad del valor del siguiente carácter codificado (o su secuencia). Luego, uno de los tipos de codificación por entropía se usa para reemplazar los tipos de datos que ocurren con frecuencia con palabras de código cortas y los raros con palabras más largas.
Utilizamos cookies para optimizar la funcionalidad del sitio web y mejorar nuestros servicios. Para obtener más información, consulte nuestra Política de privacidad.
Configuración de cookies
Cookies estrictamente necesarias
Cookies analíticas