DjVu Das DjVu-Dateiformat verwendet in der Regel die Dateinamenes .djvu und wurde 1998 als Alternative zum Adobe PDF-Format entwickelt. Aufgrund der optimierten Komprimierungsalgorithmen ist DjVu ideal geeignet für gescannte Dokumente, welche sowohl Bilder als auch Text enthalten. In den meisten Fällen sind DjVu-Dateien kompakter als vergleichbare PDFs.
Dies war die kurze Antwort auf Ihre Frage. Allerdings sind Sie wahrscheinlich auf dieser Seite gelandet, da Sie vor kurzem auf eine DjVu-Datei mit Endung .djvu gestoßen sind und sich fragen, wie Sie diese öffnen können. Daher wird der erste Teil dieses Artikels Ihnen alle Werkzeuge und Strategien vorstellen, mit denen Sie eine DjVu Datei öffnen können. Aber auch sie an tieferen Einsichten über DjVu interessiert sind, sind Sie hier genau richtig: Der zweite Teil dieses Artikels wird Ihnen sowhol historische, als auch technische Hintergrundinformationen zu diesem interessanten Dateiformat geben, also bleiben Sie dran!

Wie öffnet man eine DjVu Datei?

DjVu Specifications
Filename extensions .djvu, .djv
Internet media type image/vnd.djvu, image/x-djvu
Developed by AT&T Labs – Research
Initial release 1998; 19 years ago (1998)
Latest release
Version 26
(June 2006; vor  11 Jahren (2006-06))
GNU GPLv2
Grundsätzlich gibt es zwei Möglichkeiten, auf eine DjVu-Datei zuzugreifen. Wenn Sie nach einer schnellen Lösung suchen, können sie ihr DjVu einfach in PDF umwandeln und es damm mit Ihrem bevorzugtem PDF-Viewer wie dem Acrobat Reader öffnen:
  • 1. Für die Umwandlung von DjVu-Dateien in PDF können Sie direkt unseren DjVu nach PDF Konverter verwenden.
  • 2. Wenn Sie es vorziehen, dirket Software auf Ihrem PC zu installieren, um DjVu zu lesen, interessieren Sie sich vielleicht für unsere aktuelle Liste von DjVu Software .
Für die Umwandlung Ihres DjVu nach PDF empfehlen wir definitiv die Verwendung eines Online-Konverters. Die Installation eines Offline-Konverters ist nicht der Mühe wert, da man in diesem Fall direkt zu einem DjVu-Viewer wechseln kann, wobei man alle Vorteile von DjVu genießen kann. Es gibt mehrere gute Gründe, um sich für die zweite Option zu entscheiden. Vielleicht wird Sie der Rest des Artikels überzeugen, dies zu tun.

Woher kommt das DjVu-Dateiformat?

Das DjVu-Format wurde 1998 als Alternative zum PDF-Format bei den AT & T Labs entwickelt, wo einige weitere, bahnbrechende Erfindungen wie der Transistor gemacht wurden. Die Hauptverantwortlichen für die Entwicklungen von DjVu waren Yann LeCun, Léon Bottou, Patrick Haffner und Paul G. Howard und die prägende Idee hinter der Entwicklung von DjVu war es, ein Dateiformat zu erstellen, das für gescannte Dokumente optimiert ist, die sowohl Bilder, als auch Text enthalten. Eine wesentliche Voraussetzung dabei war, dass das neue Dateiformat für diese Art von Dokumenten in entscheidenden Punkten besser ist, als PDF. Ein wichtiger Vorteil von DjVu ist die schlanke Dateigröße der DjVu-Dateien. Daher wird es häufig für die Verbreitung von gescannten Dokumenten im Web verwendet. Im Gegensatz zu PDF ist es ein offenes Dateiformat, was bedeutet, dass es sowohl von Open Source Software Anwendungen, als auch von proprietärer Software ohne Gebühr genutzt werden kann. Das DjVu-Format verwendet normalerweise die Erweiterung .djvu oder manchmal auch nur .djv .

Warum sind DjVu-Dateien etwas Besonderes?

DjVu-Dateien verwenden fortschrittliche Kompressionstechnologien, die etwa 5 bis 10 mal besser sind, als die von JPEG und Tiff. Eine gescannte Seite in Farbe (Auflösung 300 DPI) mit einer Dateigröße von etwa 25 MB kann mit DjVu leicht auf nur 100 kB (!) komprimiert werden. Alle DjVus können mit einer Text-Layer ausgestattet werden, um sie durchsuchbar zu machen. Diese durchsuchbaren DjVus verhalten sich sehr ähnlich zu PDF-Dokumenten.

Ein Schlüssel, um diese hervorragende Komprimierung zu erreichen, ist das sogenannte Multi-Scale-Bicolor-Clustering, seine eine Vordergrund-Hintergrundmasken-Trennung ermöglicht, die viel allgemeiner ist als die normalerweise verwendete Standardtext/Bildsegmentierung. Zusammen mit einem Satz von Soft-Pattern-Matching Algorithmen schlägt die JBIG2-Kompression, die von DjVu verwendet wird, die JBIG1-Kompression, die über Jahren der Standard für zweistufige Bilder war, um eine Faktor zwei. Das Prinzip hinter der JBIG2-Codierung ist folgendes: Zuerst identifiziert die Methode nahezu identische Formen auf der Seite, z. B. mehrere Vorkommen eines bestimmten Zeichens in einer bestimmten Schriftart bzw. Stil und Größe. Dann komprimiert es das Bitmap dieser identifizierten Form separat und kodiert dann nur die Orte, an denen diese Zeichen auf der Seite erscheint. So werden ähnliche Strukturen nur einmal statt mehrfach komprimiert, was den Vorteil in Bezug auf Dateigröße erklärt, der für DjVu-Dateien charakteristisch ist.
Weitere Schlüsselkomponenten der Kompressionstechnik, die von DjVu verwendet werden, sind ein mehrstufiger sukzessiver Projektionsalgorithmus und der sogenannte ZP-Codierer.

DjVu-Dateien mit ausgeblendeten OCR-Ebenen

Vom bisher gesagten kann man sich DjVu-Dateien als lose Sammlung von gerasterten Bildern vorstellen, die keine durchsuchbaren Textinformationen enthalten und daher schwer zu handhaben sind. Müssen wir uns also an die Tatsache gewöhnen, dass PDF doch das überlegene Dateiformat ist? Natürlich nicht! Die Autoren von DjVu waren klug genug, um hier eine intelligente Lösung zu finden: Um DjVu-Dateien durchsuchbar zu machen, sodass sie sich ähnlich zu PDFs verhalten, fügten sie der Definition des Dateiformats eine versteckte OCR-Ebene hinzu. Dies bietet eine sehr ökonomische Möglichkeit, Textinformationen auf der einen Seite durchsuchbar zu halten und andererseits eine strikte Trennung zwischen dem visuellen Erscheinungsbild des Dokuments und dem Inhalt zu erreichen. Das Dokument kann so vom Leser durchsucht werden. Die meisten DjVu-Dateien, die im Web zirkulieren, enthalten eine solche Text-Ebene. Der Hauptunterschied zwischen DjVu und PDF ist, dass das DjVu-Format ein Rasterbildformat ist, während das PDF-Format ein skalierbares Vektor-Dateiformat ist. Der Trick mit dem OCR Layer erlaubt sogar das Kopieren von Text aus DjVu Dateien, welche mit einer solchen OCR-Schicht ausgestattet sind, genauso, wie man es vom Umgang mit PDFs gewöhnt ist.

Lizenzierung und Akzeptanz von DjVu

DjVu erschien zuerst in einer Open-Source-Implementierung mit dem Namen "DjVuLibre" und verwendete die GNU General Public License. Allerdings wurden die Kopierrechte an den kommerziellen Weiterentwicklungen der Kodierungssoftware über die Jahre auf mehrere Firmen übertragen, darunter ua die AT & T Corporation, LizardTech, Celartem. Obwohl PDF häufiger als DjVu verwendet wird, trotz der Tatsache, dass einige Experten der Meinung sind, dass DjVu aufgrund der überlegenen Komprimierungsalgorithmen in der Tat das bessere Format für Dokumente ist, hat DjVu aufgrund dieser Open-Source-Lizenzierung eine beträchtliche Akzeptanz erreicht.

Da DjVu auf dem Höhepunkt des Zeitalters der Digitalisierung entwickelt wurde, wo viele Bücher gescannt wurden, nutzen noch viele gescannte Dokumente und Bücher im Internet DjVu. Darüber hinaus hat das Internet-Archiv mit seinem Millionen-Book-Projekt, das Millionen von gescannten Public-Domain-Büchern bereitstellt, im Jahr 2002 auch beschlossen, DjVu zusammen mit PDF zu unterstützen.

Die technischen Spezifikationen von DjVu

DjVu wurde ursprünglich aus dem Interchange File Format (IFF) abgeleitet, das auf auf hierarchisch organisierten Chunks basiert. Wie es bei IFF der Fall ist, geht es in der Struktur um eine 4-Byte-AT & T-Magic-Nummer. Auf diese Kennung folgt eine Markierung, die angibt, ob man mit einem einseitigen (DJVU) bzw. einem mehrseitigen Dokument (DJVM) zu tun hat. Hierauf näher einzugehen, würde sicherlich über den Rahmen dieses Artikels hinausgehen. Eine weitere wichtige Spezifikation von DjVu ist jedoch der Internet-Mime-Typ für DjVu, welcher image/vnd.djvu or image/x-djvu lautet. Die aktuelle Version von DjVu ist die Version 26, die vor mehr als 10 Jahren veröffentlicht wurde.

Die Zukunft von DjVu

Obwohl es in den letzten Jahren nicht viele Fortschritte bei der Entwicklung von DjVu gab, hat nimmt die Zahl der DjVu Dokumente im Web nach wie vor zu. Dies kann auf die überzeugendste Stärke von DjVu-Dateien zurückzuführen sein, nämlich ihre unglaublich kompakte Dateigröße. In Zeiten, in denen das World Wide Web mehr und mehr an mobilen Geräten hängt und Bandbreite zum immmer größeren Kostenfaktor wird, kann DjVu mit der überlegenen Komprimierung helfen, Zeit und Geld zu sparen. Inzwischen gibt es auch Apps, die verwendet werden können, um DjVus auf Smartphones und Tablets anzuzeigen. Natürlich ist das reine Spekulation, aber vielleicht könnte die Zukunft von DjVu heller sein als seine Vergangenheit. Und tatsächlich birgt der Name DjVu eine versteckte Nachricht in sich. Er ist inspiriert durch den französischen Ausdruck DjVu [deʒavy] was so etwas bedeutet wie "bereits gesehen". Da Sie jetzt mit DjVu vertraut sind, können Sie ganz sicher sein, dass Sie es bald wieder sehen werden, solange Sie sich in der Welt des Internets bewegen.




Testimonials (Avg: 4.9 / 5) of 42