Wir arbeiten daran, die Unionpedia-App im Google Play Store wiederherzustellen
AusgehendeEingehende
🌟Wir haben unser Design für eine bessere Navigation vereinfacht!
Instagram Facebook X LinkedIn
Ihre eigene Unionpedia mit Ihrem Logo und Ihrer Domain, ab 9,99 USD/Monat
Mein Unionpedia erstellen

Analyzed Layout and Text Object

Index Analyzed Layout and Text Object

ALTO (Analyzed Layout and Text Object) ist ein offenes XML Schema zur Beschreibung von Layoutinformationen digitalisierter Objekte.

Inhaltsverzeichnis

  1. 16 Beziehungen: DFG-Praxisregeln Digitalisierung, Dublin Core, Extensible Markup Language, FineReader, GitHub, Goobi, HOCR (Standard), Industriestandard, Kitodo, Library of Congress, Metadata Encoding & Transmission Standard, Metadaten, Open Archives Initiative, Preservation Metadata: Implementation Strategies, Tesseract (Software), Texterkennung.

DFG-Praxisregeln Digitalisierung

Die Praxisregeln „Digitalisierung“, die ursprünglich von der Deutschen Forschungsgemeinschaft (DFG) initiiert worden sind, bilden seit 2009 eine Grundlage für zahlreiche DFG-finanzierte Digitalisierungsprojekte für Text- und Bilddokumente des materiellen Kulturerbes aus deutschen Bibliotheken, Museen, Archiven und anderen bestandshaltenden Institutionen weltweit.

Sehen Analyzed Layout and Text Object und DFG-Praxisregeln Digitalisierung

Dublin Core

Beispieldatensatz des Werkes ''Mein Katalonien'' von George OrwellEin Link zu diesem Datensatz findet sich hier: https://lccn.loc.gov/38020780, abgerufen am 27. Dezember 2014. Dublin Core ist ein Metadatenschema zur Beschreibung von elektronischen Ressourcen.

Sehen Analyzed Layout and Text Object und Dublin Core

Extensible Markup Language

Die Extensible Markup Language (dt. Erweiterbare Auszeichnungssprache), abgekürzt XML, ist eine Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten im Format einer Textdatei, die sowohl von Menschen als auch von Maschinen lesbar ist.

Sehen Analyzed Layout and Text Object und Extensible Markup Language

FineReader

FineReader ist eine proprietäre Desktop-Texterkennungssoftware der in Moskau gegründeten Firma ABBYY für Windows-Betriebssysteme und Mac OS X., macwelt.de vom 2.

Sehen Analyzed Layout and Text Object und FineReader

GitHub

GitHub ist ein Onlinedienst zur Softwareentwicklung und Versionsverwaltung für Softwareprojekte auf Git-Basis.

Sehen Analyzed Layout and Text Object und GitHub

Goobi

Goobi ist ein Softwarepaket für Digitalisierungsprojekte in Bibliotheken, Archiven, Museen und Dokumentationszentren.

Sehen Analyzed Layout and Text Object und Goobi

HOCR (Standard)

hOCR ist ein offener Standard, der ein Datenformat beschreibt, das der Repräsentation von Texterkennungsergebnissen dient.

Sehen Analyzed Layout and Text Object und HOCR (Standard)

Industriestandard

Ein Industriestandard oder – vor allem im englischen Sprachraum – De-facto-Standard, seltener auch Quasistandard, ist ein technischer Standard, der nicht durch ein Normengremium verabschiedet, sondern von Industrieunternehmen definiert wurde.

Sehen Analyzed Layout and Text Object und Industriestandard

Kitodo

Kitodo ist ein Softwarepaket für Digitalisierungsprojekte in Bibliotheken, Archiven, Museen und Dokumentationszentren.

Sehen Analyzed Layout and Text Object und Kitodo

Library of Congress

Die Library of Congress (LoC) ist die öffentlich zugängliche Forschungsbibliothek des Kongresses der Vereinigten Staaten.

Sehen Analyzed Layout and Text Object und Library of Congress

Metadata Encoding & Transmission Standard

Der Metadata Encoding & Transmission Standard (METS) ist ein mit XML Schema definiertes XML-Format zur Beschreibung von digitalen Sammlungen von Objekten mit Metadaten.

Sehen Analyzed Layout and Text Object und Metadata Encoding & Transmission Standard

Metadaten

Im 21. Jahrhundert beziehen sich Metadaten in der Regel auf digitale Formen. Metadaten finden sich aber auch schon in traditionellen Kartenkatalogen. Die Karten bestehen aus Informationen (Autor, Titel, Thema usw.) über die Bücher einer Bibliothek. Metadaten oder Metainformationen sind strukturierte Daten, die Informationen über Merkmale anderer Daten enthalten.

Sehen Analyzed Layout and Text Object und Metadaten

Open Archives Initiative

Die Open Archives Initiative (OAI) ist eine Initiative von Betreibern von Preprint- und anderen Dokumentenservern, um die auf diesen Servern abgelegten elektronischen Publikationen im Internet besser auffindbar und nutzbar zu machen.

Sehen Analyzed Layout and Text Object und Open Archives Initiative

Preservation Metadata: Implementation Strategies

Preservation Metadata: Implementation Strategies, kurz PREMIS, ist eine Initiative, die den gleichnamigen Standard bei der Library of Congress vorantreibt.

Sehen Analyzed Layout and Text Object und Preservation Metadata: Implementation Strategies

Tesseract (Software)

Tesseract 3.03 in einer Linux-Konsole Tesseract ist eine freie Software zur Texterkennung.

Sehen Analyzed Layout and Text Object und Tesseract (Software)

Texterkennung

Beispiel einer fehlerhaften automatischen Texterkennung. Aktuelle OCR-Software erkennt diesen Text fehlerfrei. Texterkennung ist ein Begriff aus der Informationstechnik.

Sehen Analyzed Layout and Text Object und Texterkennung

Auch bekannt als ALTO.