50 Beziehungen: Analyzed Layout and Text Object, Antiqua, Apache Lucene, Apache-Lizenz, Arabische Schrift, Arabische Sprache, Archivista, Bidirektionaler Text, Bitfarm-Archiv, Capella (Notensatzprogramm), Chinesische Schrift, CuneiForm, Deutsche Forschungsgemeinschaft, Devanagari, DFG-Praxisregeln Digitalisierung, Dokumentenmanagement, Dokumentenscanner, FineReader, Fraktur (Schrift), Freie Software, GitHub, Google Books, Google Developers, Griechisches Alphabet, Hebräische Sprache, Hebräisches Alphabet, HOCR (Standard), HP Inc., ImageMagick, Internet Archive, IText, Künstliches neuronales Netz, Kyrillisches Alphabet, Lateinisches Schriftsystem, Linux, Linux-Distribution, OCRopus, Partitur, PDF24 Creator, Portable Document Format, Retrodigitalisierung, SourceForge, Spam, Sprachen Indiens, Sprachmodell, Tagged Image File Format, Texterkennung, Universitätsbibliothek Mannheim, University of Nevada, Las Vegas, Unix.
Analyzed Layout and Text Object
ALTO (Analyzed Layout and Text Object) ist ein offenes XML Schema zur Beschreibung von Layoutinformationen digitalisierter Objekte.
Neu!!: Tesseract (Software) und Analyzed Layout and Text Object · Mehr sehen »
Antiqua
Antiqua im Vergleich: Unterschiede bei Bögen von runden (oberstes Beispiel: Antiqua) und gebrochenen Schriftarten (untere vier Beispiele) Antiqua (‚alt‘, ‚einstig‘) bezeichnet die Schriftgattung der ab 1470 für den Buchdruck entstandenen, gut lesbaren Satzschriften des lateinischen Alphabets mit Groß- und Kleinbuchstaben (Versalien und Minuskeln), die heutzutage die Standard-Schriftgattung für Mengentext in westlichen Sprachen ist.
Neu!!: Tesseract (Software) und Antiqua · Mehr sehen »
Apache Lucene
Apache Lucene ist eine Programmbibliothek zur Volltextsuche.
Neu!!: Tesseract (Software) und Apache Lucene · Mehr sehen »
Apache-Lizenz
Die Apache-Lizenz ist eine durch die Free Software Foundation anerkannte Freie-Software-Lizenz der Apache Software Foundation, jedoch keine Copyleft-Lizenz.
Neu!!: Tesseract (Software) und Apache-Lizenz · Mehr sehen »
Arabische Schrift
Die arabische Schrift ist heute eine der am weitesten verbreiteten Schriften der Welt und blickt im engeren Sinne auf eine Geschichte von etwa eineinhalb Jahrtausenden zurück, obwohl ihr Ursprung, wie der fast aller Alphabetschriften, älter ist.
Neu!!: Tesseract (Software) und Arabische Schrift · Mehr sehen »
Arabische Sprache
Die arabische Sprache (kurz Arabisch; Eigenbezeichnung, kurz) ist die am weitesten verbreitete Sprache des semitischen Zweigs der afroasiatischen Sprachfamilie und in ihrer Hochsprachform eine der sechs Amtssprachen der Vereinten Nationen.
Neu!!: Tesseract (Software) und Arabische Sprache · Mehr sehen »
Archivista
Archivista (italienisch für „Archivar“) ist eine Webanwendung zur Realisierung des papierlosen Büros.
Neu!!: Tesseract (Software) und Archivista · Mehr sehen »
Bidirektionaler Text
Bidirektionale Texte sind meist mehrsprachige Texte, in denen Schriften mit zwei Schreibrichtungen verwendet werden.
Neu!!: Tesseract (Software) und Bidirektionaler Text · Mehr sehen »
Bitfarm-Archiv
Bitfarm-Archiv ist eine Open-Source-Software für das Dokumentenmanagement elektronischer und papiergebundener Dokumente aller Art.
Neu!!: Tesseract (Software) und Bitfarm-Archiv · Mehr sehen »
Capella (Notensatzprogramm)
capella ist ein Notensatzprogramm, das vom Unternehmen capella-Software AG aus Söhrewald entwickelt und vertrieben wird (man beachte die Schreibweise mit einem p; vgl. a cappella, hingegen z. B. capella coloniensis).
Neu!!: Tesseract (Software) und Capella (Notensatzprogramm) · Mehr sehen »
Chinesische Schrift
Die chinesische Schrift oder Hànzì ist die Schrift, in der die chinesischen Sprachen, vor allem das Hochchinesische, seit über 3000 Jahren geschrieben werden.
Neu!!: Tesseract (Software) und Chinesische Schrift · Mehr sehen »
CuneiForm
CuneiForm (engl. für keilschriftlich) ist eine Texterkennungssoftware für gedruckte Erkennungsvorlagen des russischen Unternehmens Cognitive Technologies (Präsidentin Olga Anatoljewna Uskowa), die mittlerweile als freie Software verfügbar ist.
Neu!!: Tesseract (Software) und CuneiForm · Mehr sehen »
Deutsche Forschungsgemeinschaft
Die DFG-Geschäftsstelle in Bonn-Bad Godesberg (2006) Die Deutsche Forschungsgemeinschaft (DFG) ist eine fachübergreifende Einrichtung zur Förderung der Wissenschaft und Forschung in der Bundesrepublik Deutschland.
Neu!!: Tesseract (Software) und Deutsche Forschungsgemeinschaft · Mehr sehen »
Devanagari
Devanagari (IAST) ist eine indische Schrift, die zur Schreibung von Sanskrit, Prakrit und einigen modernen indischen Sprachen wie Hindi und Marathi verwendet wird.
Neu!!: Tesseract (Software) und Devanagari · Mehr sehen »
DFG-Praxisregeln Digitalisierung
Die Praxisregeln „Digitalisierung“, die ursprünglich von der Deutschen Forschungsgemeinschaft (DFG) initiiert worden sind, bilden seit 2009 eine Grundlage für zahlreiche DFG-finanzierte Digitalisierungsprojekte für Text- und Bilddokumente des materiellen Kulturerbes aus deutschen Bibliotheken, Museen, Archiven und anderen bestandshaltenden Institutionen weltweit.
Neu!!: Tesseract (Software) und DFG-Praxisregeln Digitalisierung · Mehr sehen »
Dokumentenmanagement
Der Begriff Dokumentenmanagement (auch Dokumentenverwaltungssystem) bezeichnet die datenbankgestützte Verwaltung elektronischer Dokumente.
Neu!!: Tesseract (Software) und Dokumentenmanagement · Mehr sehen »
Dokumentenscanner
Dokumentenscanner dienen der raschen Erfassung großer Dokumentenmengen in möglichst kurzer Zeit.
Neu!!: Tesseract (Software) und Dokumentenscanner · Mehr sehen »
FineReader
FineReader ist eine proprietäre Desktop-Texterkennungssoftware der in Moskau gegründeten Firma ABBYY für Windows-Betriebssysteme und Mac OS X., macwelt.de vom 2.
Neu!!: Tesseract (Software) und FineReader · Mehr sehen »
Fraktur (Schrift)
Historische Darstellung der Verbreitung der Schriftarten in Europa aus ''Petermanns Mitteilungen'' (1901). Die Darstellung stellt die Verhältnisse jedoch unrealistisch dar: In Dänemark und Norwegen wurde zu dieser Zeit bereits überwiegend Antiqua verwendet, und in Deutschland wurde – wie bereits aus der Beschriftung der Karte erkennbar – nicht ausschließlich in Fraktur gedruckt. Die Fraktur (von „Bruch“, seit Mitte des 15. Jahrhunderts auch „gebrochene Schrift“) ist eine Schriftart aus der Gruppe der gebrochenen Schriften.
Neu!!: Tesseract (Software) und Fraktur (Schrift) · Mehr sehen »
Freie Software
Concept-Map rund um Freie Software Freie Software (freiheitsgewährende Software, oder auch libre software) bezeichnet Software, die die Freiheit von Computernutzern in den Mittelpunkt stellt.
Neu!!: Tesseract (Software) und Freie Software · Mehr sehen »
GitHub
GitHub ist ein Onlinedienst zur Softwareentwicklung und Versionsverwaltung für Softwareprojekte auf Git-Basis.
Neu!!: Tesseract (Software) und GitHub · Mehr sehen »
Google Books
Google Books ist die größte private Sammlung retrodigitalisierter Bücher.
Neu!!: Tesseract (Software) und Google Books · Mehr sehen »
Google Developers
Google Developers (vormals Google Code) ist eine Bündelung mehrerer Onlinedienste von Google für Softwareentwicklungswerkzeuge, Programmierschnittstellen (API) und technische Ressourcen.
Neu!!: Tesseract (Software) und Google Developers · Mehr sehen »
Griechisches Alphabet
Wegweiser in griechischer Schrift auf Ikaria. Schriftart: ''Transport'' Das griechische Alphabet (auch ellinikí alfavíta) ist die Schrift, in der die griechische Sprache seit dem 9. Jahrhundert v. Chr.
Neu!!: Tesseract (Software) und Griechisches Alphabet · Mehr sehen »
Hebräische Sprache
Hebräisch (hebräisch ‘Ivrit) gehört zur kanaanäischen Gruppe des Nordwestsemitischen und damit zur afroasiatischen Sprachfamilie, auch semitisch-hamitische Sprachfamilie genannt.
Neu!!: Tesseract (Software) und Hebräische Sprache · Mehr sehen »
Hebräisches Alphabet
Das hebräische Alphabet (hebräisch, kurz schlicht Alef-Bet oder jiddisch Alef-Bejs genannt) ist das aus 22 Buchstaben bestehende Alphabet des antiken und modernen Hebräisch sowie des biblischen und talmudischen Aramäisch.
Neu!!: Tesseract (Software) und Hebräisches Alphabet · Mehr sehen »
HOCR (Standard)
hOCR ist ein offener Standard, der ein Datenformat beschreibt, das der Repräsentation von Texterkennungsergebnissen dient.
Neu!!: Tesseract (Software) und HOCR (Standard) · Mehr sehen »
HP Inc.
Die HP Inc. (bis 1. November 2015 Hewlett-Packard Company) ist einer der größten US-amerikanischen PC- und Druckerhersteller, registriert in Wilmington, Delaware und mit der Unternehmenszentrale in Palo Alto, Kalifornien.
Neu!!: Tesseract (Software) und HP Inc. · Mehr sehen »
ImageMagick
ImageMagick ist ein freies Softwarepaket zur Erstellung und Bearbeitung von Raster- und Vektorgrafiken.
Neu!!: Tesseract (Software) und ImageMagick · Mehr sehen »
Internet Archive
Das Internet Archive in San Francisco ist ein gemeinnütziges Projekt, das 1996 von Brewster Kahle gegründet wurde und seit 2007 den offiziellen Status einer Bibliothek hat.
Neu!!: Tesseract (Software) und Internet Archive · Mehr sehen »
IText
iText ist eine freie Programmbibliothek zur Erzeugung und Bearbeitung von PDF-Dateien mittels der Programmiersprachen Java oder C#.NET.
Neu!!: Tesseract (Software) und IText · Mehr sehen »
Künstliches neuronales Netz
Künstliche neuronale Netze, auch künstliche neuronale Netzwerke, kurz: KNN (englisch artificial neural network, ANN), sind Netze aus künstlichen Neuronen.
Neu!!: Tesseract (Software) und Künstliches neuronales Netz · Mehr sehen »
Kyrillisches Alphabet
neben der lateinischen Schrift der Amtssprache Die kyrillische Schrift, selten zyrillische Schrift, bis in das 19.
Neu!!: Tesseract (Software) und Kyrillisches Alphabet · Mehr sehen »
Lateinisches Schriftsystem
Das lateinische Schriftsystem ist ein alphabetisches Schriftsystem.
Neu!!: Tesseract (Software) und Lateinisches Schriftsystem · Mehr sehen »
Linux
Als Linux (deutsch) oder GNU/Linux (siehe GNU/Linux-Namensstreit) bezeichnet man in der Regel freie, unixähnliche Mehrbenutzer-Betriebssysteme, die auf dem Linux-Kernel und wesentlich auf GNU-Software basieren.
Neu!!: Tesseract (Software) und Linux · Mehr sehen »
Linux-Distribution
Zeitleiste mit der Entwicklung verschiedener Linux-Distributionen Eine Linux-Distribution ist eine Auswahl aufeinander abgestimmter Software um den Linux-Kernel, bei dem es sich dabei in einigen Fällen auch um einen mehr oder minder angepassten und meist in enger Abstimmung mit Upstream selbst gepflegten Distributionskernel handelt.
Neu!!: Tesseract (Software) und Linux-Distribution · Mehr sehen »
OCRopus
OCRopus (auch ocropy) ist eine freie Software zur Dokumentanalyse und Texterkennung mit einem sehr modularen Entwurf.
Neu!!: Tesseract (Software) und OCRopus · Mehr sehen »
Partitur
Akkoladenklammern zusammengefasst; auch pausierende Instrumente wie Piccoloflöte oder Posaunen werden notiert. Eine Partitur (‚Einteilung‘) ist eine Aufzeichnung mehrstimmiger Musik in Notenschrift, bei der die einzelnen Stimmen übereinander angeordnet und mit senkrecht durchlaufenden Taktstrichen verbunden sind.
Neu!!: Tesseract (Software) und Partitur · Mehr sehen »
PDF24 Creator
PDF24 Creator ist eine Anwendungssoftware der geek Software GmbH zur Erstellung von PDF-Dateien aus beliebigen Anwendungen heraus.
Neu!!: Tesseract (Software) und PDF24 Creator · Mehr sehen »
Portable Document Format
Das Portable Document Format (englisch; kurz PDF; deutsch (trans)portables Dokumentenformat) ist ein plattformunabhängiges Dateiformat, das 1992 vom Unternehmen Adobe Inc. entwickelt und veröffentlicht wurde und aktuell von der PDF Association weiterentwickelt wird.
Neu!!: Tesseract (Software) und Portable Document Format · Mehr sehen »
Retrodigitalisierung
Buch-Scanner (Zentralbibliothek Zürich) Als Retrodigitalisierung oder retrospektive Digitalisierung bezeichnet man die Digitalisierung analoger Publikationen (u. a. Printmedien, Filme, Tonbänder).
Neu!!: Tesseract (Software) und Retrodigitalisierung · Mehr sehen »
SourceForge
SourceForge (wörtlich „QuellSchmiede“, aber hier im Sinne von Quelltext-Schmiede) ist ein Filehosting-Dienst für Softwareprojekte.
Neu!!: Tesseract (Software) und SourceForge · Mehr sehen »
Spam
Eine typische Spam-Mail, ''scheinbar'' für ein Potenzmittel (2011) Diagramm des Spamverkehrs im Internet (1): Spamwebseite (2): Spammer (3): Spam (4): Infizierte Computer (5): Virus oder Trojaner (6): E-Mail-Server (7): Computernutzer (8): Internetverkehr Als Spam oder Junk (für,Müll') werden unerwünschte, in der Regel auf elektronischem Weg übertragene massenhafte Nachrichten (Informationen) bezeichnet, die dem Empfänger unverlangt zugestellt werden, ihn oft belästigen und auch häufig werbenden Inhalt enthalten.
Neu!!: Tesseract (Software) und Spam · Mehr sehen »
Sprachen Indiens
Die Sprachfamilien Indiens 10-Rupien-Banknote von 1920 mit Wertangabe in verschiedenen Sprachen Indiens Zu den Sprachen Indiens gehören über 100 Sprachen verschiedener Sprachfamilien.
Neu!!: Tesseract (Software) und Sprachen Indiens · Mehr sehen »
Sprachmodell
Ein SprachmodellWie meistens in der modernen Informatik ist auch hier die englische Bezeichnung präsenter.
Neu!!: Tesseract (Software) und Sprachmodell · Mehr sehen »
Tagged Image File Format
Das Tagged Image File Format (TIFF oder auch kurz TIF) ist ein Dateiformat zur Speicherung von Bilddaten.
Neu!!: Tesseract (Software) und Tagged Image File Format · Mehr sehen »
Texterkennung
Beispiel einer fehlerhaften automatischen Texterkennung. Aktuelle OCR-Software erkennt diesen Text fehlerfrei. Texterkennung ist ein Begriff aus der Informationstechnik.
Neu!!: Tesseract (Software) und Texterkennung · Mehr sehen »
Universitätsbibliothek Mannheim
Die Universitätsbibliothek Mannheim dient der Literaturversorgung und Informationsvermittlung für Forschung, Lehre, Studium und Weiterbildung der Universität Mannheim.
Neu!!: Tesseract (Software) und Universitätsbibliothek Mannheim · Mehr sehen »
University of Nevada, Las Vegas
Universitätsgebäude der UNLVCampus der UNLV, im Hintergrund das ''Student Union building'' Lied Library, die größte Bibliothek in Las Vegas Football-Übungsplatz der ''UNLV Rebels'' Die University of Nevada, Las Vegas (auch UNLV genannt) ist eine staatliche Universität in Paradise, einem Vorort von Las Vegas im US-Bundesstaat Nevada.
Neu!!: Tesseract (Software) und University of Nevada, Las Vegas · Mehr sehen »
Unix
Unix-Befehls ls -l Unix ist ein Mehrbenutzer-Betriebssystem für Computer.
Neu!!: Tesseract (Software) und Unix · Mehr sehen »