Compresión

Índice
1.Introducción y método Huffman
1.1.Introducción
1.2.Método Huffman
















Carácter |
I |
M |
A |
G |
E |
N |
_ |
D |
T |
L |
Frecuencia |
3 |
1 |
2 |
2 |
1 |
1 |
1 |
1 |
1 |
1 |
Probabilidad |
3/14 |
1/14 |
2/14 |
2/14 |
1/14 |
1/14 |
1/14 |
1/14 |
1/14 |
1/14 |
Carácter |
I |
M |
A |
G |
E |
N |
_ |
D |
T |
L |
Frecuencia |
3 |
1 |
2 |
2 |
1 |
1 |
1 |
1 |
1 |
1 |
Probabilidad |
3/14 |
1/14 |
2/14 |
2/14 |
1/14 |
1/14 |
1/14 |
1/14 |
1/14 |
1/14 |
Codificación |
00 |
011 |
100 |
010 |
1010 |
1011 |
1100 |
1101 |
1110 |
1111 |










2.Algunos métodos de compresión
2.1.Compresión diferencial




2.2.Compresión RLL (Run Length Limited)
b) 1001110100000000001001000100000000000000000100000010100000000111
b) 110110110001111000110011
2.3.Compresión aritmética








2.4.LZW

3.Otros formatos y software de compresión
3.1.GIF, JPEG y MPEG
3.2.ZIP






-
Add to Zip: para comprimir los ficheros seleccionados y ponerlos en un fichero de extensión .zip.
-
Add and E-Mail directorio.zip: esta opción comprime los ficheros seleccionados, crea un fichero tipo .zip y lo adjunta a un mensaje de correo electrónico a punto para su envío.

-
Maximum (slowest): es la compresión máxima, aunque requiere un poco más de tiempo.
-
Normal: compresión normal.
-
Fast: menor compresión pero más rápida de realizar.
-
Super fast: menor compresión que el caso anterior e incluso más rápida de realizar.
-
None: esta opción no comprime, simplemente almacena uno o varios ficheros en un archivo ZIP sin comprimirlos.
-
Add (and replace) files: añade todos los ficheros seleccionados al archivo ZIP que estemos creando.
-
Freshen existing files: esta opción renueva posibles ficheros existentes en el archivo ZIP, en caso de que estemos añadiendo ficheros a un archivo ZIP ya existente.
-
Move files: esta opción actúa igual que la opción Add, pero una vez incluidos los ficheros en el archivo ZIP los borra del disco.
-
Update (and add) files: comprobad cuáles de los ficheros seleccionados no están en un archivo Zip existente y cuáles han cambiado desde la creación del archivo Zip y los actualiza.
-
Save full path info: marcando esta casilla guardaremos los ficheros y, al descomprimirlos, se mantendrán ordenados según en qué carpetas de Windows están almacenados. Si dejamos la casilla sin marcar, tendremos todos los ficheros en una misma carpeta en el momento de la descompresión.
-
Store filenames in 8.3 format: si dejamos esta casilla sin marcar, los nombres de los ficheros se almacenan usando su nombre en Windows (es decir, acepta nombres de fichero largos). Marcando esta casilla, los ficheros comprimidos se guardan en el archivo ZIP con su nombre de ocho dígitos.
3.3.MP3
Ejercicios de autoevaluación
a) los métodos LZW y los métodos ARJ.
a) es uno de los más potentes métodos de compresión de datos y, a pesar de que fue el primer método que se creó, sigue siendo el más usado.
a) 45%.
a) 700 bytes.

a) 7 1 1 0 3 1 1 3 1 1 0 0.
a) sin pérdidas gracias a que la longitud de almacenamiento es limitada.
a) un algoritmo basado en el método de compresión LZW.
a) dibujo lineal.
a) que crea archivos con un formato que se puede distribuir por la Red y su tasa de compresión es superior al 75% para cualquier fichero.
a) basado en el uso de las probabilidades de aparición de caracteres.
a) JAAJAJ.
a) 0,4.
a) es un método con pérdidas, ya que la descompresión no recupera nunca la información original.
a) 12,5%.
a) 100011.
Solucionario
1. a) Incorrecto. LZW y ARJ son sólo dos algoritmos de compresión.b) Incorrecto. También hay métodos de compresión para datos, vídeo, etc.
c) Correcto.
2. a) Incorrecto. Actualmente está en desuso.
b) Correcto.
c) Incorrecto. Es un método sin pérdidas para compresión de datos.
3. a) Incorrecto. Repasad vuestros cálculos.
b) Correcto.
c) Incorrecto. Repasad vuestros cálculos.
4. a) Correcto.
b) Incorrecto. Para almacenar 16 tonos de gris, necesitaremos 4 bits en sistema binario: de 0000 a 1111. Calculad el número de bits que ocupará la imagen sin comprimir y aplicad después la tasa de compresión. Recordad que 1 byte equivale a 8 bits.
c) Incorrecto. Para almacenar 16 tonos de gris, necesitaremos 4 bits en sistema binario: de 0000 a 1111. Calculad el número de bits que ocupará la imagen sin comprimir, y aplicad después la tasa de compresión. Recordad que 1 byte equivale a 8 bits.
5. a) Incorrecto. Recordad que tenéis que calcular la diferencia entre el tono de gris de un píxel con el anterior.
b) Correcto.
c) Incorrecto. Recordad que para este método la imagen se codifica por filas en zigzag.
6. a) Incorrecto. Al fijar la longitud de almacenamiento, podemos perder información en la compresión por RLL.
b) Correcto.
c) Incorrecto. Sí que es un método de compresión.
7. a) Correcto.
b) Incorrecto. JPEG y GIF no usan el mismo formato de compresión.
c) Incorrecto. A pesar de que la compresión diferencial sea para imágenes, el formato GIF usa otro método de compresión.
8. a) Incorrecto. Falso. Releed el apartado sobre JPEG.
b) Incorrecto. Falso. Releed el apartado sobre JPEG.
c) Correcto.
9. a) Incorrecto. Un archivo ZIP se puede distribuir por la Red, pero la tasa de compresión a formato ZIP no tiene por qué ser superior al 75%.
b) Incorrecto. Admite nombres largos y puede comprimir cualquier tipo de fichero.
c) Correcto.
10. a) Incorrecto. La versión básica de este método no utiliza las probabilidades en ningún momento.
b) Correcto.
c) Incorrecto. La versión básica de este método es sin pérdidas.
11. a) Incorrecto. Notad que la primera entrada del diccionario es 256=JA.
b) Incorrecto. Notad que comienza por JA.
c) Correcto.
12. a) Incorrecto. En este caso, la segunda letra sería una Y.
b) Incorrecto. En este caso, la segunda letra también sería una Y.
c) Correcto.
13. a) Incorrecto. Sí es posible recuperar la información original.
b) Correcto.
c) Incorrecto. No es un método de diccionario.
14. a) Incorrecto. Calculad cuántos bits son necesarios para codificar sólo los tres caracteres G, M y D, además de buscar la compresión Huffman de esta palabra.
b) Incorrecto. Calculad cuántos bits son necesarios para codificar sólo los tres caracteres G, M y D, además de buscar la compresión Huffman de esta palabra.
c) Correcto.
15. a) Correcto.
b) Incorrecto. Esta palabra no se puede descomprimir con esta codificación.
c) Incorrecto. Se obtiene la palabra IALL, que no existe en castellano.