Inhaltsverzeichnis
16 Beziehungen: DFG-Praxisregeln Digitalisierung, Dublin Core, Extensible Markup Language, FineReader, GitHub, Goobi, HOCR (Standard), Industriestandard, Kitodo, Library of Congress, Metadata Encoding & Transmission Standard, Metadaten, Open Archives Initiative, Preservation Metadata: Implementation Strategies, Tesseract (Software), Texterkennung.
DFG-Praxisregeln Digitalisierung
Die Praxisregeln „Digitalisierung“, die ursprünglich von der Deutschen Forschungsgemeinschaft (DFG) initiiert worden sind, bilden seit 2009 eine Grundlage für zahlreiche DFG-finanzierte Digitalisierungsprojekte für Text- und Bilddokumente des materiellen Kulturerbes aus deutschen Bibliotheken, Museen, Archiven und anderen bestandshaltenden Institutionen weltweit.
Sehen Analyzed Layout and Text Object und DFG-Praxisregeln Digitalisierung
Dublin Core
Beispieldatensatz des Werkes ''Mein Katalonien'' von George OrwellEin Link zu diesem Datensatz findet sich hier: https://lccn.loc.gov/38020780, abgerufen am 27. Dezember 2014. Dublin Core ist ein Metadatenschema zur Beschreibung von elektronischen Ressourcen.
Sehen Analyzed Layout and Text Object und Dublin Core
Extensible Markup Language
Die Extensible Markup Language (dt. Erweiterbare Auszeichnungssprache), abgekürzt XML, ist eine Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten im Format einer Textdatei, die sowohl von Menschen als auch von Maschinen lesbar ist.
Sehen Analyzed Layout and Text Object und Extensible Markup Language
FineReader
FineReader ist eine proprietäre Desktop-Texterkennungssoftware der in Moskau gegründeten Firma ABBYY für Windows-Betriebssysteme und Mac OS X., macwelt.de vom 2.
Sehen Analyzed Layout and Text Object und FineReader
GitHub
GitHub ist ein Onlinedienst zur Softwareentwicklung und Versionsverwaltung für Softwareprojekte auf Git-Basis.
Sehen Analyzed Layout and Text Object und GitHub
Goobi
Goobi ist ein Softwarepaket für Digitalisierungsprojekte in Bibliotheken, Archiven, Museen und Dokumentationszentren.
Sehen Analyzed Layout and Text Object und Goobi
HOCR (Standard)
hOCR ist ein offener Standard, der ein Datenformat beschreibt, das der Repräsentation von Texterkennungsergebnissen dient.
Sehen Analyzed Layout and Text Object und HOCR (Standard)
Industriestandard
Ein Industriestandard oder – vor allem im englischen Sprachraum – De-facto-Standard, seltener auch Quasistandard, ist ein technischer Standard, der nicht durch ein Normengremium verabschiedet, sondern von Industrieunternehmen definiert wurde.
Sehen Analyzed Layout and Text Object und Industriestandard
Kitodo
Kitodo ist ein Softwarepaket für Digitalisierungsprojekte in Bibliotheken, Archiven, Museen und Dokumentationszentren.
Sehen Analyzed Layout and Text Object und Kitodo
Library of Congress
Die Library of Congress (LoC) ist die öffentlich zugängliche Forschungsbibliothek des Kongresses der Vereinigten Staaten.
Sehen Analyzed Layout and Text Object und Library of Congress
Metadata Encoding & Transmission Standard
Der Metadata Encoding & Transmission Standard (METS) ist ein mit XML Schema definiertes XML-Format zur Beschreibung von digitalen Sammlungen von Objekten mit Metadaten.
Sehen Analyzed Layout and Text Object und Metadata Encoding & Transmission Standard
Metadaten
Im 21. Jahrhundert beziehen sich Metadaten in der Regel auf digitale Formen. Metadaten finden sich aber auch schon in traditionellen Kartenkatalogen. Die Karten bestehen aus Informationen (Autor, Titel, Thema usw.) über die Bücher einer Bibliothek. Metadaten oder Metainformationen sind strukturierte Daten, die Informationen über Merkmale anderer Daten enthalten.
Sehen Analyzed Layout and Text Object und Metadaten
Open Archives Initiative
Die Open Archives Initiative (OAI) ist eine Initiative von Betreibern von Preprint- und anderen Dokumentenservern, um die auf diesen Servern abgelegten elektronischen Publikationen im Internet besser auffindbar und nutzbar zu machen.
Sehen Analyzed Layout and Text Object und Open Archives Initiative
Preservation Metadata: Implementation Strategies
Preservation Metadata: Implementation Strategies, kurz PREMIS, ist eine Initiative, die den gleichnamigen Standard bei der Library of Congress vorantreibt.
Sehen Analyzed Layout and Text Object und Preservation Metadata: Implementation Strategies
Tesseract (Software)
Tesseract 3.03 in einer Linux-Konsole Tesseract ist eine freie Software zur Texterkennung.
Sehen Analyzed Layout and Text Object und Tesseract (Software)
Texterkennung
Beispiel einer fehlerhaften automatischen Texterkennung. Aktuelle OCR-Software erkennt diesen Text fehlerfrei. Texterkennung ist ein Begriff aus der Informationstechnik.
Sehen Analyzed Layout and Text Object und Texterkennung
Auch bekannt als ALTO.

