Logo
Unionpedia
Kommunikation
Jetzt bei Google Play
Neu! Laden Sie Unionpedia auf Ihrem Android™-Gerät herunter!
Herunterladen
Schneller Zugriff als Browser!
 

Tesseract (Software)

Index Tesseract (Software)

Tesseract 3.03 in einer Linux-Konsole Tesseract ist eine freie Software zur Texterkennung.

50 Beziehungen: Analyzed Layout and Text Object, Antiqua, Apache Lucene, Apache-Lizenz, Arabische Schrift, Arabische Sprache, Archivista, Bidirektionaler Text, Bitfarm-Archiv, Capella (Notensatzprogramm), Chinesische Schrift, CuneiForm, Deutsche Forschungsgemeinschaft, Devanagari, DFG-Praxisregeln Digitalisierung, Dokumentenmanagement, Dokumentenscanner, FineReader, Fraktur (Schrift), Freie Software, GitHub, Google Books, Google Developers, Griechisches Alphabet, Hebräische Sprache, Hebräisches Alphabet, HOCR (Standard), HP Inc., ImageMagick, Internet Archive, IText, Künstliches neuronales Netz, Kyrillisches Alphabet, Lateinisches Schriftsystem, Linux, Linux-Distribution, OCRopus, Partitur, PDF24 Creator, Portable Document Format, Retrodigitalisierung, SourceForge, Spam, Sprachen Indiens, Sprachmodell, Tagged Image File Format, Texterkennung, Universitätsbibliothek Mannheim, University of Nevada, Las Vegas, Unix.

Analyzed Layout and Text Object

ALTO (Analyzed Layout and Text Object) ist ein offenes XML Schema zur Beschreibung von Layoutinformationen digitalisierter Objekte.

Neu!!: Tesseract (Software) und Analyzed Layout and Text Object · Mehr sehen »

Antiqua

Antiqua im Vergleich: Unterschiede bei Bögen von runden (oberstes Beispiel: Antiqua) und gebrochenen Schriftarten (untere vier Beispiele) Antiqua (‚alt‘, ‚einstig‘) bezeichnet die Schriftgattung der ab 1470 für den Buchdruck entstandenen, gut lesbaren Satzschriften des lateinischen Alphabets mit Groß- und Kleinbuchstaben (Versalien und Minuskeln), die heutzutage die Standard-Schriftgattung für Mengentext in westlichen Sprachen ist.

Neu!!: Tesseract (Software) und Antiqua · Mehr sehen »

Apache Lucene

Apache Lucene ist eine Programmbibliothek zur Volltextsuche.

Neu!!: Tesseract (Software) und Apache Lucene · Mehr sehen »

Apache-Lizenz

Die Apache-Lizenz ist eine durch die Free Software Foundation anerkannte Freie-Software-Lizenz der Apache Software Foundation, jedoch keine Copyleft-Lizenz.

Neu!!: Tesseract (Software) und Apache-Lizenz · Mehr sehen »

Arabische Schrift

Die arabische Schrift ist heute eine der am weitesten verbreiteten Schriften der Welt und blickt im engeren Sinne auf eine Geschichte von etwa eineinhalb Jahrtausenden zurück, obwohl ihr Ursprung, wie der fast aller Alphabetschriften, älter ist.

Neu!!: Tesseract (Software) und Arabische Schrift · Mehr sehen »

Arabische Sprache

Die arabische Sprache (kurz Arabisch; Eigenbezeichnung, kurz) ist die am weitesten verbreitete Sprache des semitischen Zweigs der afroasiatischen Sprachfamilie und in ihrer Hochsprachform eine der sechs Amtssprachen der Vereinten Nationen.

Neu!!: Tesseract (Software) und Arabische Sprache · Mehr sehen »

Archivista

Archivista (italienisch für „Archivar“) ist eine Webanwendung zur Realisierung des papierlosen Büros.

Neu!!: Tesseract (Software) und Archivista · Mehr sehen »

Bidirektionaler Text

Bidirektionale Texte sind meist mehrsprachige Texte, in denen Schriften mit zwei Schreibrichtungen verwendet werden.

Neu!!: Tesseract (Software) und Bidirektionaler Text · Mehr sehen »

Bitfarm-Archiv

Bitfarm-Archiv ist eine Open-Source-Software für das Dokumentenmanagement elektronischer und papiergebundener Dokumente aller Art.

Neu!!: Tesseract (Software) und Bitfarm-Archiv · Mehr sehen »

Capella (Notensatzprogramm)

capella ist ein Notensatzprogramm, das vom Unternehmen capella-Software AG aus Söhrewald entwickelt und vertrieben wird (man beachte die Schreibweise mit einem p; vgl. a cappella, hingegen z. B. capella coloniensis).

Neu!!: Tesseract (Software) und Capella (Notensatzprogramm) · Mehr sehen »

Chinesische Schrift

Die chinesische Schrift oder Hànzì ist die Schrift, in der die chinesischen Sprachen, vor allem das Hochchinesische, seit über 3000 Jahren geschrieben werden.

Neu!!: Tesseract (Software) und Chinesische Schrift · Mehr sehen »

CuneiForm

CuneiForm (engl. für keilschriftlich) ist eine Texterkennungssoftware für gedruckte Erkennungsvorlagen des russischen Unternehmens Cognitive Technologies (Präsidentin Olga Anatoljewna Uskowa), die mittlerweile als freie Software verfügbar ist.

Neu!!: Tesseract (Software) und CuneiForm · Mehr sehen »

Deutsche Forschungsgemeinschaft

Die DFG-Geschäftsstelle in Bonn-Bad Godesberg (2006) Die Deutsche Forschungsgemeinschaft (DFG) ist eine fachübergreifende Einrichtung zur Förderung der Wissenschaft und Forschung in der Bundesrepublik Deutschland.

Neu!!: Tesseract (Software) und Deutsche Forschungsgemeinschaft · Mehr sehen »

Devanagari

Devanagari (IAST) ist eine indische Schrift, die zur Schreibung von Sanskrit, Prakrit und einigen modernen indischen Sprachen wie Hindi und Marathi verwendet wird.

Neu!!: Tesseract (Software) und Devanagari · Mehr sehen »

DFG-Praxisregeln Digitalisierung

Die Praxisregeln „Digitalisierung“, die ursprünglich von der Deutschen Forschungsgemeinschaft (DFG) initiiert worden sind, bilden seit 2009 eine Grundlage für zahlreiche DFG-finanzierte Digitalisierungsprojekte für Text- und Bilddokumente des materiellen Kulturerbes aus deutschen Bibliotheken, Museen, Archiven und anderen bestandshaltenden Institutionen weltweit.

Neu!!: Tesseract (Software) und DFG-Praxisregeln Digitalisierung · Mehr sehen »

Dokumentenmanagement

Der Begriff Dokumentenmanagement (auch Dokumentenverwaltungssystem) bezeichnet die datenbankgestützte Verwaltung elektronischer Dokumente.

Neu!!: Tesseract (Software) und Dokumentenmanagement · Mehr sehen »

Dokumentenscanner

Dokumentenscanner dienen der raschen Erfassung großer Dokumentenmengen in möglichst kurzer Zeit.

Neu!!: Tesseract (Software) und Dokumentenscanner · Mehr sehen »

FineReader

FineReader ist eine proprietäre Desktop-Texterkennungssoftware der in Moskau gegründeten Firma ABBYY für Windows-Betriebssysteme und Mac OS X., macwelt.de vom 2.

Neu!!: Tesseract (Software) und FineReader · Mehr sehen »

Fraktur (Schrift)

Historische Darstellung der Verbreitung der Schriftarten in Europa aus ''Petermanns Mitteilungen'' (1901). Die Darstellung stellt die Verhältnisse jedoch unrealistisch dar: In Dänemark und Norwegen wurde zu dieser Zeit bereits überwiegend Antiqua verwendet, und in Deutschland wurde – wie bereits aus der Beschriftung der Karte erkennbar – nicht ausschließlich in Fraktur gedruckt. Die Fraktur (von „Bruch“, seit Mitte des 15. Jahrhunderts auch „gebrochene Schrift“) ist eine Schriftart aus der Gruppe der gebrochenen Schriften.

Neu!!: Tesseract (Software) und Fraktur (Schrift) · Mehr sehen »

Freie Software

Concept-Map rund um Freie Software Freie Software (freiheitsgewährende Software, oder auch libre software) bezeichnet Software, die die Freiheit von Computernutzern in den Mittelpunkt stellt.

Neu!!: Tesseract (Software) und Freie Software · Mehr sehen »

GitHub

GitHub ist ein Onlinedienst zur Softwareentwicklung und Versionsverwaltung für Softwareprojekte auf Git-Basis.

Neu!!: Tesseract (Software) und GitHub · Mehr sehen »

Google Books

Google Books ist die größte private Sammlung retrodigitalisierter Bücher.

Neu!!: Tesseract (Software) und Google Books · Mehr sehen »

Google Developers

Google Developers (vormals Google Code) ist eine Bündelung mehrerer Onlinedienste von Google für Softwareentwicklungswerkzeuge, Programmierschnittstellen (API) und technische Ressourcen.

Neu!!: Tesseract (Software) und Google Developers · Mehr sehen »

Griechisches Alphabet

Wegweiser in griechischer Schrift auf Ikaria. Schriftart: ''Transport'' Das griechische Alphabet (auch ellinikí alfavíta) ist die Schrift, in der die griechische Sprache seit dem 9. Jahrhundert v. Chr.

Neu!!: Tesseract (Software) und Griechisches Alphabet · Mehr sehen »

Hebräische Sprache

Hebräisch (hebräisch ‘Ivrit) gehört zur kanaanäischen Gruppe des Nordwestsemitischen und damit zur afroasiatischen Sprachfamilie, auch semitisch-hamitische Sprachfamilie genannt.

Neu!!: Tesseract (Software) und Hebräische Sprache · Mehr sehen »

Hebräisches Alphabet

Das hebräische Alphabet (hebräisch, kurz schlicht Alef-Bet oder jiddisch Alef-Bejs genannt) ist das aus 22 Buchstaben bestehende Alphabet des antiken und modernen Hebräisch sowie des biblischen und talmudischen Aramäisch.

Neu!!: Tesseract (Software) und Hebräisches Alphabet · Mehr sehen »

HOCR (Standard)

hOCR ist ein offener Standard, der ein Datenformat beschreibt, das der Repräsentation von Texterkennungsergebnissen dient.

Neu!!: Tesseract (Software) und HOCR (Standard) · Mehr sehen »

HP Inc.

Die HP Inc. (bis 1. November 2015 Hewlett-Packard Company) ist einer der größten US-amerikanischen PC- und Druckerhersteller, registriert in Wilmington, Delaware und mit der Unternehmenszentrale in Palo Alto, Kalifornien.

Neu!!: Tesseract (Software) und HP Inc. · Mehr sehen »

ImageMagick

ImageMagick ist ein freies Softwarepaket zur Erstellung und Bearbeitung von Raster- und Vektorgrafiken.

Neu!!: Tesseract (Software) und ImageMagick · Mehr sehen »

Internet Archive

Das Internet Archive in San Francisco ist ein gemeinnütziges Projekt, das 1996 von Brewster Kahle gegründet wurde und seit 2007 den offiziellen Status einer Bibliothek hat.

Neu!!: Tesseract (Software) und Internet Archive · Mehr sehen »

IText

iText ist eine freie Programmbibliothek zur Erzeugung und Bearbeitung von PDF-Dateien mittels der Programmiersprachen Java oder C#.NET.

Neu!!: Tesseract (Software) und IText · Mehr sehen »

Künstliches neuronales Netz

Künstliche neuronale Netze, auch künstliche neuronale Netzwerke, kurz: KNN (englisch artificial neural network, ANN), sind Netze aus künstlichen Neuronen.

Neu!!: Tesseract (Software) und Künstliches neuronales Netz · Mehr sehen »

Kyrillisches Alphabet

neben der lateinischen Schrift der Amtssprache Die kyrillische Schrift, selten zyrillische Schrift, bis in das 19.

Neu!!: Tesseract (Software) und Kyrillisches Alphabet · Mehr sehen »

Lateinisches Schriftsystem

Das lateinische Schriftsystem ist ein alphabetisches Schriftsystem.

Neu!!: Tesseract (Software) und Lateinisches Schriftsystem · Mehr sehen »

Linux

Als Linux (deutsch) oder GNU/Linux (siehe GNU/Linux-Namensstreit) bezeichnet man in der Regel freie, unixähnliche Mehrbenutzer-Betriebssysteme, die auf dem Linux-Kernel und wesentlich auf GNU-Software basieren.

Neu!!: Tesseract (Software) und Linux · Mehr sehen »

Linux-Distribution

Zeitleiste mit der Entwicklung verschiedener Linux-Distributionen Eine Linux-Distribution ist eine Auswahl aufeinander abgestimmter Software um den Linux-Kernel, bei dem es sich dabei in einigen Fällen auch um einen mehr oder minder angepassten und meist in enger Abstimmung mit Upstream selbst gepflegten Distributionskernel handelt.

Neu!!: Tesseract (Software) und Linux-Distribution · Mehr sehen »

OCRopus

OCRopus (auch ocropy) ist eine freie Software zur Dokumentanalyse und Texterkennung mit einem sehr modularen Entwurf.

Neu!!: Tesseract (Software) und OCRopus · Mehr sehen »

Partitur

Akkoladenklammern zusammengefasst; auch pausierende Instrumente wie Piccoloflöte oder Posaunen werden notiert. Eine Partitur (‚Einteilung‘) ist eine Aufzeichnung mehrstimmiger Musik in Notenschrift, bei der die einzelnen Stimmen übereinander angeordnet und mit senkrecht durchlaufenden Taktstrichen verbunden sind.

Neu!!: Tesseract (Software) und Partitur · Mehr sehen »

PDF24 Creator

PDF24 Creator ist eine Anwendungssoftware der geek Software GmbH zur Erstellung von PDF-Dateien aus beliebigen Anwendungen heraus.

Neu!!: Tesseract (Software) und PDF24 Creator · Mehr sehen »

Portable Document Format

Das Portable Document Format (englisch; kurz PDF; deutsch (trans)portables Dokumentenformat) ist ein plattformunabhängiges Dateiformat, das 1992 vom Unternehmen Adobe Inc. entwickelt und veröffentlicht wurde und aktuell von der PDF Association weiterentwickelt wird.

Neu!!: Tesseract (Software) und Portable Document Format · Mehr sehen »

Retrodigitalisierung

Buch-Scanner (Zentralbibliothek Zürich) Als Retrodigitalisierung oder retrospektive Digitalisierung bezeichnet man die Digitalisierung analoger Publikationen (u. a. Printmedien, Filme, Tonbänder).

Neu!!: Tesseract (Software) und Retrodigitalisierung · Mehr sehen »

SourceForge

SourceForge (wörtlich „QuellSchmiede“, aber hier im Sinne von Quelltext-Schmiede) ist ein Filehosting-Dienst für Softwareprojekte.

Neu!!: Tesseract (Software) und SourceForge · Mehr sehen »

Spam

Eine typische Spam-Mail, ''scheinbar'' für ein Potenzmittel (2011) Diagramm des Spamverkehrs im Internet (1): Spamwebseite (2): Spammer (3): Spam (4): Infizierte Computer (5): Virus oder Trojaner (6): E-Mail-Server (7): Computernutzer (8): Internetverkehr Als Spam oder Junk (für,Müll') werden unerwünschte, in der Regel auf elektronischem Weg übertragene massenhafte Nachrichten (Informationen) bezeichnet, die dem Empfänger unverlangt zugestellt werden, ihn oft belästigen und auch häufig werbenden Inhalt enthalten.

Neu!!: Tesseract (Software) und Spam · Mehr sehen »

Sprachen Indiens

Die Sprachfamilien Indiens 10-Rupien-Banknote von 1920 mit Wertangabe in verschiedenen Sprachen Indiens Zu den Sprachen Indiens gehören über 100 Sprachen verschiedener Sprachfamilien.

Neu!!: Tesseract (Software) und Sprachen Indiens · Mehr sehen »

Sprachmodell

Ein SprachmodellWie meistens in der modernen Informatik ist auch hier die englische Bezeichnung präsenter.

Neu!!: Tesseract (Software) und Sprachmodell · Mehr sehen »

Tagged Image File Format

Das Tagged Image File Format (TIFF oder auch kurz TIF) ist ein Dateiformat zur Speicherung von Bilddaten.

Neu!!: Tesseract (Software) und Tagged Image File Format · Mehr sehen »

Texterkennung

Beispiel einer fehlerhaften automatischen Texterkennung. Aktuelle OCR-Software erkennt diesen Text fehlerfrei. Texterkennung ist ein Begriff aus der Informationstechnik.

Neu!!: Tesseract (Software) und Texterkennung · Mehr sehen »

Universitätsbibliothek Mannheim

Die Universitätsbibliothek Mannheim dient der Literaturversorgung und Informationsvermittlung für Forschung, Lehre, Studium und Weiterbildung der Universität Mannheim.

Neu!!: Tesseract (Software) und Universitätsbibliothek Mannheim · Mehr sehen »

University of Nevada, Las Vegas

Universitätsgebäude der UNLVCampus der UNLV, im Hintergrund das ''Student Union building'' Lied Library, die größte Bibliothek in Las Vegas Football-Übungsplatz der ''UNLV Rebels'' Die University of Nevada, Las Vegas (auch UNLV genannt) ist eine staatliche Universität in Paradise, einem Vorort von Las Vegas im US-Bundesstaat Nevada.

Neu!!: Tesseract (Software) und University of Nevada, Las Vegas · Mehr sehen »

Unix

Unix-Befehls ls -l Unix ist ein Mehrbenutzer-Betriebssystem für Computer.

Neu!!: Tesseract (Software) und Unix · Mehr sehen »

Leitet hier um:

FreeOCR.

AusgehendeEingehende
Hallo! Wir sind auf Facebook! »