Home

Digitalisierung ist der Trend in allen Branchen. Ob Industrie 4.0, selbstfahrende Autos oder Drohnen, die Pakete zustellen. Alle sprechen von Digitalisierung und Big Data. Dabei scheint es, als ob der Fokus stark auf Prozessen liegt. Funktionierende Digitalisierung braucht aber vor allem eines: Daten. Intelligente Lösungen sind nur so intelligent wie die Inhalte, der Content, auf denen sie basieren. Daten und Content unterscheiden sich voneinander: Content liegt in Form von Textdateien, Audiodateien oder anderen Formaten vor und hat einen entscheidenden Nachteil: Er ist unstrukturiert. Damit werden der Zugriff und die Weiterverarbeitung erschwert. Daten hingegen liegen in strukturierter Form vor und können so für Analyse und Weiterverarbeitung genutzt werden. Im digitalen Zeitalter gilt: Jede Firma ist nur so gut, wie ihr Content– und wie ihre Fähigkeit, aus diesem Content Daten Informationen zu generieren, die dann analysiert und zu verwertetweiter verarbeitet werden.

 

Content – wo und wie?

Doch daran scheitert es häufig. In jedem Unternehmen gibt es zahllosen Inhalt, oft digitalisiert. Briefe, Personalakten, Rechnungen, Office-Dokumente oder E-Mails enthalten viele Inhalte, aber keine strukturierten Informationen. Die Fragen, die damit verbunden sind, lauten: Wo liegen die Inhalte, die ich für ein bestimmtes Projekt brauche? In welcher Form liegen sie vor? Wie kann ich daraus Daten generieren und zur Weiterverarbeitung nutzen?

tool-e-byte: automatisch zu strukturierten Daten

Bei all diesen Fragen ist tool-e-byte Ihr kompetenter Partner. Wir machen aus Content strukturierte Daten – mit einem hohen Grad an Automatisierung. Die notwendigen Korrekturen erledigt unser spezialisiertes Team aus Germanisten. Wir passen die Software an Ihre Bedürfnisse an und bieten alle Services, die Sie brauchen, um aus Ihren Daten den richtigen Nutzen ziehen zu können.

 
 

Beispielhafte Anwendungsfälle:

  • Publishing: Ihr Unternehmen ist im Bereich Medien / Verlagswesen tätig. Sie möchten Ihren Kunden die Inhalte digital zur Verfügung stellen. Dabei sollen die Kunden in der Lage sein, spezifische Suchen in Ihren Inhalten durchzuführen oder auch Metadaten zu erhalten, um beispielsweise eigene Recherchen zu erstellen.
  • Anzeigenannahme: Die Dateien, die bei Ihnen in der Anzeigenannahme angeliefert werden, liegen als pdf oder jpg vor. Sie möchten die Anzeigen in strukturierte Daten umwandeln, um sie suchfähig zu machen oder für Portale und Marktplätze zugänglich zu machen.
  • Sie möchten Artikel aus Ihren Zeitungen, Zeitschriften für Dienstleister (Datenbanken) wie z.B PMG, SMD, Genios oder andere zur Verfügung stellen. Zu Recherchezwecken müssen aus PDF-Dateien deshalb XML-Dateien erstellt werden.
  • Sie möchten ePUB oder Mobi aus Ihrem Content erstellen? Sowohl für pdf als auch XML oder Word als Input wird der Content in das entsprechende Format umgewandelt.
  • Ihr Posteingang wird manuell abgewickelt. Die eingehenden Dokumente werden gescannt und der jeweiligen Abteilung in Form von PDF-Dateien zur Verfügung gestellt. Sie möchten die Inhalte aus diesen Dokumenten weiterverwenden. Wenn beispielsweise ein Kunde Ihnen einen Brief (oder eine E-Mail) mit einer Beschwerde schickt, dann möchten Sie diese Beschwerde in eine Datenbank integrieren, mit deren Hilfe Sie Ihre Produkt- und Servicequalität verbessern wollen.

Ihre Anforderungen - Unser Leistungsspektrum:

  • Digitalisierung vorhandenen nicht-digitalen Contents, z.B. Bilder oder Papierarchive
  • Strukturierung bestehenden Contents durch Übertragung in XML-Format
  • Erhöhung des Automatisierungsgrads bei der Erfassung von Content
  • Annotation von Artikeln und Konvertierung nach XML
  • Extrahieren von eingebetteten Bildern und Grafiken mit automatischer XML-Verlinkung
 
 

Warum PDF für Big Data nicht genügt…

PDF hat sich als digitales Dateiformat fest etabliert. Die Vorteile liegen auf der Hand: Plattform-unabhängig ermöglicht es die originalgetreue Wiedergabe von Text, Bild und Grafik auf allen Betriebssystemen und Endgeräten. PDF dient vorrangig dem Austausch von Daten und der Archivierung. Wer aber Daten weiterverarbeiten möchte, partiell in elektronischen Medien anzeigen möchte oder intelligente Suche und Verschlagwortung einsetzen möchte, für den reicht PDF nicht aus. Gefragt ist die Konvertierung in XML. Das ist die Ideallösung, weil XML die Daten strukturiert. Damit ergeben sich neue Möglichkeiten für die Datennutzung und -weiterverarbeitung.