Wir haben alle schon von Dateikomprimierung gehört. Jeder, der regelmäßig Dateien aus dem Internet herunterlädt, ist mit Formaten wie ZIP und RAR vertraut, und jeder, der Mediendateien bearbeitet, weiß, dass Komprimierung erforderlich ist, um Bilder, Musik und Videos im Web zu teilen, ohne die gesamte Bandbreite zu verbrauchen. Die Dateikomprimierung ist der Kern der Funktionsweise des Webs, argumentieren Sie vielleicht, weil wir damit Dateien teilen können, deren Übertragung sonst zu lange dauert. Aber wie funktioniert es?
Es ist nichts Magisches, aber es ist das Ergebnis von viel harter Arbeit von vielen sehr klugen Leuten. Lassen Sie uns untersuchen, wie die Dateikomprimierung funktioniert, indem Sie die beiden Hauptkomprimierungstypen verlustfrei und verlustbehaftet betrachten.
Nur eine Warnung - ich werde hier die Dinge zu sehr vereinfachen, um es für nicht-mathematische Majors lesbar zu machen. Sieh dir die verlinkten Wikipedia-Artikel an, um mehr Tiefe zu erhalten, und die Quellen von Wikipedia für noch mehr.
Verlustfreie Kompression
Die verlustfreie Komprimierung funktioniert im Wesentlichen durch Entfernen von Redundanz. Was bedeutet das? Lassen Sie uns die Dinge vereinfachen. Dieser Stapel Ziegelsteine wird unsere Daten darstellen:
Wie Sie sehen können, haben wir zwei rote Steine, fünf gelbe und drei blaue. Der einfachste Weg, dies darzustellen, ist, wie Sie oben sehen: die Ziegel selbst. Aber das ist nicht der einzige Weg, dies darzustellen. Ich könnte das auch tun:
Im obigen Bild sehen Sie genau die gleichen Informationen - zwei rot, fünf gelb und drei blau -, aber es nimmt deutlich weniger Platz in Anspruch. Ich habe redundante Steine mit Zahlen dargestellt, was bedeutet, dass ich nur drei Steine brauche, um zehn zu repräsentieren.
Dies gibt Ihnen eine ungefähre Vorstellung davon, wie eine verlustfreie Komprimierung möglich ist. Informationen, die redundant sind, werden durch Anweisungen ersetzt, die dem Computer mitteilen, wie viele identische Daten sich wiederholen. Ein weiteres vereinfachtes Beispiel:
fffffffuuuuuuuuuuuu
Kann "komprimiert" werden zu:
f7u12
Dies ist natürlich nur eine Methode der verlustfreien Komprimierung, aber sie zeigt, wie dies möglich ist. Andere mathematische Tricks werden verwendet, aber die wichtigste Sache, die man sich über verlustfreie Komprimierung merken sollte, ist, dass während der zeitweiligen Speicherung von Speicherplatz die ursprüngliche Datei vollständig aus der komprimierten rekonstruiert werden kann. Wenn Sie drei Steine mit Zahlen sehen, wissen Sie genau, wie man den Stapel macht. Keine Information ist verloren, wie der Name verlustfrei impliziert.
Programme wie WinZip basieren auf verlustfreier Komprimierung. Sie entfernen diese redundanten Informationen, wenn Sie die Datei komprimieren (oder "zippen") und sie beim Entpacken (oder "Entpacken") wiederherstellen. Nichts ist verloren.
In der Bildwelt verwenden PNG-Dateien auch verlustfreie Komprimierung. Aus diesem Grund bieten sie eine kleinere Dateigröße für Bilder mit viel gleichförmigem Platz: Diese redundanten Informationen werden mithilfe von Anweisungen dargestellt.
Natürlich ist das alles eine zu starke Vereinfachung, aber es geht um den grundlegenden Punkt. Lesen Sie mehr über verlustfreie Kompression bei Wikipedia, wenn Sie interessiert sind.
Verlustbehaftete Komprimierung
Natürlich können Sie nur mit verlustfreien Methoden so viel erreichen. Zum Glück sind sie nicht die einzige Option: Sie können Informationen auch einfach entfernen. Dies wird als verlustbehaftete Kompression bezeichnet und ist nicht so verrückt, wie es klingt. Tatsächlich haben Sie wahrscheinlich viele Dateien auf Ihrem Computer, die mit verlustreicher Komprimierung erstellt wurden.
Ein MP3 zum Beispiel. Wenn Sie wie die meisten Menschen sind, speichert Ihr Computer Tausende von ihnen für Sie, aber wussten Sie, dass sie nicht alle Audioinformationen enthalten, die die Originalaufnahme gemacht hat? Einige Geräusche, die Menschen nicht oder kaum hören können, werden als Teil der Kompression entfernt. Je mehr Sie eine Datei komprimieren, desto mehr Informationen werden entfernt. Deshalb klingt eine überkomprimierte Datei matschig.
Verlustbehaftete Komprimierung wird meist für Mediendateien verwendet - Bilder, Ton und Video. Die Verwendung einer verlustbehafteten Komprimierung für eine Textdatei wäre problematisch, da die resultierenden Informationen verstümmelt würden. Es ist jedoch nicht immer notwendig, dass Mediendateien alle Informationen enthalten.
Ein weiteres Beispiel für verlustbehaftete Komprimierung ist das JPEG-Bild. Im Allgemeinen müssen Bilder, die im Internet gesehen werden, nicht so hochwertig sein wie Bilder, die zum Drucken vorgesehen sind. So können Sie viele überflüssige Informationen in einem Web-Bild entfernen, selbst wenn dies schrecklich aussehen würde.
Natürlich verringert das wiederholte Komprimieren einer Datei mit verlustbehafteten Methoden die Qualität - jedes Mal, wenn Sie es tun, gehen mehr Daten verloren. Unten ist ein Foto, das ich dreimal zusammengedrückt habe, um dies zu demonstrieren:
Sie können von links nach rechts sehen, wie die Qualität abnimmt. Je nachdem, wofür das Bild verwendet wird, spielt es keine Rolle, weshalb eine verlustbehaftete Komprimierung vorhanden ist.
Es ist wichtig, daran zu denken, dass Dateien, die mit verlustbehafteten Methoden komprimiert wurden, tatsächlich Daten verlieren, was bedeutet, dass Sie die ursprüngliche Datei nicht aus einer komprimierten Datei mit verlustreichen Methoden wiederherstellen können. Es ist offensichtlich, wenn Sie darüber nachdenken, aber viele Druckprojekte wurden ruiniert, weil sie diesen wichtigen Punkt nicht verstanden haben.
Ich habe wirklich nur die Oberfläche gekratzt, also bitte: Lesen Sie mehr über verlustbehaftete Komprimierung bei Wikipedia. Es ist irgendwie faszinierend.
Fazit
Die Komprimierung hat das Web zu dem gemacht, was es ist. In den Tagen der Einwahl brachten komprimierte Bilder Fotos zu unserem Browser, zumindest nicht mit einer akzeptablen Geschwindigkeit. Komprimiertes Video macht Sites wie YouTube möglich, und jeder, der Filesharing-Netzwerke nutzt, ist mit ZIP- und RAR-Dateien vertraut.
Hast du etwas hinzuzufügen? Ich bin mir sicher, dass ich einige wichtige Punkte verpasst habe, also erziehe mich (und die anderen Leser) in den Kommentaren weiter unten.
Bildquelle: Frühlingsbild über Shutterstock