Glossary

Begriffsklärungen

Content

Content bedeutet übersetzt nichts Anderes als „Inhalt“. Im Zusammenhang mit Websites ist es der Inhalt einer beliebigen Website. Dazu zählen alle auf dieser Seite dargestellten Medien: Texte, Bilder, Videodateien oder Audiodateien.

Konvertierung (Wikipedia)

Konvertierung bezeichnet in der Informatik die Überführung einer Datei von einem Dateiformat in ein anderes mittels eines Dateikonverters*. Prinzipiell gibt es dabei drei Möglichkeiten:
1. Verlustfreie Konvertierung
Bei der Umwandlung gehen keine Informationen verloren, die neue Datei enthält alle Informationen, die im Original vorhanden waren. Zum Beispiel bei der Konvertierung eines Rasterbildes von TIFF nach PNG.
2. Verlustbehaftete Konvertierung
Sie liegt vor, wenn in der neuen Datei nicht mehr alle Informationen enthalten sind, die im Original vorhanden waren. Das geschieht, wenn das Zielformat die Daten verlustbehaftet komprimiert oder nicht in der Lage ist, alle Informationen des Originals darzustellen. Zum Beispiel ist die Konvertierung einer Audiodatei von WAV nach MP3 verlustbehaftet. Der umgekehrte Vorgang, von MP3 nach WAV, ist jedoch verlustfrei. Auch die Umwandlung eines Farb- in ein Graustufenbild ist verlustbehaftet (umgekehrt wiederum nicht). Oder Konvertierung von HTML in eine Textdatei: Hierbei geht jegliche Formatierung verloren.
3. Sinnhafte Konvertierung
Bei dieser Konvertierungsart werden Daten „dem Sinne nach“ konvertiert, also unter Beibehaltung des als wesentlich betrachteten Inhaltes. Dies kann mit oder ohne Informationsverlust geschehen, die Datei kann bei der Konvertierung auch mit Informationen aus zusätzlichen Quellen angereichert werden. Zum Beispiel die Konvertierung einer Tabelle von Microsoft Excel XLS nach CSV oder umgekehrt. Die Konvertierung einer Bestellung von EDIFACT nach IDoc oder umgekehrt.

*Ein Dateikonverter ist eine Softwarekomponente oder ein Computerprogramm, das eine Datei von einem Format in ein anderes umwandelt. Dabei bleibt die Originaldatei erhalten.

Retro-Digitalisierung

Unter Retrodigitalisierung (auch: retrospektive Digitalisierung) versteht man die Digitalisierung analoger Publikationen, z.B. Printmedien, Filme oder Tonbänder. Eingesetzt wurde diese Technik zunächst vorwiegend in Bibliotheken und Archiven. Aber auch Unternehmen – im Medienbereich und überall dort, wo Publikationen entstehen – haben zunehmend Bedarf an Retro-Digitalisierung. Ziel ist es, entweder eine wissenschaftliche Nutzung zu erlauben, einen weltweiten Zugang zu den Datenbeständen zu sichern oder auch Bestände durch die Digitalisierung zu erhalten. Gerade bei Medienunternehmen hat der weltweite Zugang zu den Inhalten einen weiteren Aspekt: Hier werden die Inhalte z.B. benötigt, um Recherchen durchzuführen oder eine Gesamtschau auf ein Thema zu ermöglichen.

Technisch wird die Retro-Digitalisierung meistens durch Imagedigitalisierung mit Scannern (manchmal auch mithilfe von Digitalfotografie) realisiert und für eine Volltext-Digitalisierung die Texterkennung mit OCR (Optical Character Recognition) genutzt.

XML (Extensible Mark-up Language)

XML ist eine Auszeichnungssprache, die sich heute als Standard zur Erstellung von strukturierten Dokumenten im Internet etabliert hat. Mittels XML werden hierarchisch strukturierte Daten in Form von Textdateien wiedergegeben. „Extensible“ steht dabei für eine besondere Fähigkeit von XML: Anders als z.B. bei HTML ist der Nutzer bei XML nicht auf vorgegebene Markierungselemente (Tags) angewiesen, sondern kann eigene Möglichkeiten zur Auszeichnung nutzen. Diese eigenen Tags definieren nicht nur, wie der Inhalt dargestellt wird; sie sind auch in der Lage, die Bedeutung des Inhalts zu erfassen. Damit bietet XML weitreichende Möglichkeiten für den Zugriff auf und den Austausch von Informationen im Internet.