Logo
Unionpedia
Kommunikation
Jetzt bei Google Play
Neu! Laden Sie Unionpedia auf Ihrem Android™-Gerät herunter!
Frei
Schneller Zugriff als Browser!
 

Tokenisierung

Index Tokenisierung

Tokenisierung bezeichnet in der Computerlinguistik die Segmentierung eines Textes in Einheiten der Wortebene (manchmal auch Sätze, Absätze o. Ä.). Die Tokenisierung des Textes ist Voraussetzung für dessen Weiterverarbeitung, beispielsweise zur syntaktischen Analyse durch Parser, im Textmining oder Information Retrieval.

42 Beziehungen: Anleihe, Übergabe (Sachenrecht), Bargeld, Blockchain, Buchgeld, Chinesische Schrift, Computerlinguistik, Computerprogramm, Dezentrales Netzwerk, Digitale Daten, Digitalisierung, Effektive Stücke, Eintragung, Finanzinstrument, Finanzprodukt, Finanzwesen, Gesetz über elektronische Wertpapiere, Informatik, Information Retrieval, Interpunktionszeichen, Japanische Schrift, Kryptowährung, Kryptowert, Leerzeichen, Parser, Programmiersprache, Satz (Grammatik), Schrift, Segmentierung (Linguistik), Springer Spektrum, Syntaktik, Text, Text Mining, Token (Übersetzerbau), Tokenbasierte Kompression, Trägermedium, Trend (Statistik), Vermögensgegenstand, Wertpapierhandel, Wertpapierrecht, Wertpapierregister, Wort.

Anleihe

Anleihe über 5000 US-$ der ''New York Central and Hudson River Railroad Company'' vom 29. Oktober 1894 ''Anleihe des Deutschen Reichs'' bzw. ''Schuldverschreibung'' vom 1. August 1922, kurz vor Beginn der Hyperinflation Eine Anleihe (auch festverzinsliches Wertpapier, Rentenpapier, Schuldverschreibung oder Obligation, oder debenture bond) ist ein zins­tragendes Wertpapier, das dem Gläubiger das Recht auf Rückzahlung sowie auf Zahlung vereinbarter Zinsen einräumt.

Neu!!: Tokenisierung und Anleihe · Mehr sehen »

Übergabe (Sachenrecht)

Unter Übergabe einer Sache versteht die Rechtswissenschaft den einvernehmlichen Wechsel im Besitz durch Einräumung des unmittelbaren Besitzes vom bisherigen an den neuen Besitzer.

Neu!!: Tokenisierung und Übergabe (Sachenrecht) · Mehr sehen »

Bargeld

Bargeld verschiedener Währungen Bargeld ist Geld in physischer (körperlicher) Form als Banknoten und Münzen, das im Zahlungsverkehr als gesetzliches Zahlungsmittel für die Bezahlung von Gütern oder Dienstleistungen oder für sonstige Transaktionen (beispielsweise Schenkungen) dient.

Neu!!: Tokenisierung und Bargeld · Mehr sehen »

Blockchain

Die bestimmende Blockchain (schwarz) besteht aus der längsten Folge von Blöcken ausgehend vom Ursprung (grün) zum aktuellen Block. Alternative Ketten verwaisen (lila), sobald sie kürzer als eine andere Kette sind. Schema eines Blockes in der Blockchain Video: Funktionsweise einer Blockchain am Beispiel einer Geldüberweisung veranschaulicht. Eine Blockchain (auch Block Chain, für Blockkette) ist eine kontinuierlich erweiterbare Liste von Datensätzen in einzelnen Blöcken.

Neu!!: Tokenisierung und Blockchain · Mehr sehen »

Buchgeld

Buchgeld (auch Giralgeld (von zu) oder Geschäftsbankengeld) ist, als Forderung auf Bargeld, ein Zahlungsmittel, das im Bankwesen durch Übertragung von Girokonto zu Girokonto mittels Buchungen genutzt werden kann.

Neu!!: Tokenisierung und Buchgeld · Mehr sehen »

Chinesische Schrift

Die chinesische Schrift oder Hànzì ist die Schrift, in der die chinesischen Sprachen, vor allem das Hochchinesische, seit über 3000 Jahren geschrieben werden.

Neu!!: Tokenisierung und Chinesische Schrift · Mehr sehen »

Computerlinguistik

Die Computerlinguistik (CL) oder linguistische Datenverarbeitung (LDV) untersucht, wie natürliche Sprache in Form von Text- oder Sprachdaten mit Hilfe des Computers algorithmisch verarbeitet werden kann.

Neu!!: Tokenisierung und Computerlinguistik · Mehr sehen »

Computerprogramm

Ein Computerprogramm oder kurz Programm ist eine den Regeln einer bestimmten Programmiersprache genügende Folge von Anweisungen (bestehend aus Deklarationen und Instruktionen), um bestimmte Funktionen bzw.

Neu!!: Tokenisierung und Computerprogramm · Mehr sehen »

Dezentrales Netzwerk

Das dezentrale Netzwerk ist ein Begriff aus der Informatik und beschreibt die Vernetzung von Computern.

Neu!!: Tokenisierung und Dezentrales Netzwerk · Mehr sehen »

Digitale Daten

Digitale Daten sind in der Informationstheorie und -technik diskret dargestellte Daten, die als Informationen oder Nachrichten dienen.

Neu!!: Tokenisierung und Digitale Daten · Mehr sehen »

Digitalisierung

Digitalisierung in der British Library Unter Digitalisierung (von und) versteht man die Umwandlung von analogen, d. h.

Neu!!: Tokenisierung und Digitalisierung · Mehr sehen »

Effektive Stücke

Aktie von Barnum & Bailey Limited Als effektive Stücke (auch Tafeln) werden im Bankwesen physisch vorhandene, also tatsächlich gedruckte Effekten oder Edelmetalle bezeichnet.

Neu!!: Tokenisierung und Effektive Stücke · Mehr sehen »

Eintragung

Eintragung ist ein Rechtsbegriff, der den amtlichen Vermerk von Rechts- und Tatsachenänderungen in öffentlichen Registern wie dem Grundbuch, Handels-, Genossenschafts-, Güterrechts-, Partnerschafts- und Vereinsregister beschreibt.

Neu!!: Tokenisierung und Eintragung · Mehr sehen »

Finanzinstrument

Finanzinstrument ist ein Rechtsbegriff auf dem Gebiet der Rechnungslegung und des Wertpapierrechts.

Neu!!: Tokenisierung und Finanzinstrument · Mehr sehen »

Finanzprodukt

Unter Finanzprodukt (auch Finanzanlage, Finanzinstrument oder Anlageprodukt) versteht man im Finanzwesen Produkte, die einem Anleger als Geld- oder Kapitalanlage (Investition) oder einem Spekulanten zur Spekulation dienen.

Neu!!: Tokenisierung und Finanzprodukt · Mehr sehen »

Finanzwesen

Das Finanzwesen ist ein Teil der Finanzwirtschaft und befasst sich mit der Beschaffung und Verwendung von Geld oder Kapital sowie mit der Abwicklung des Zahlungsverkehrs.

Neu!!: Tokenisierung und Finanzwesen · Mehr sehen »

Gesetz über elektronische Wertpapiere

Das Gesetz über elektronische Wertpapiere (eWpG) vom 3.

Neu!!: Tokenisierung und Gesetz über elektronische Wertpapiere · Mehr sehen »

Informatik

Lambda lc.svg Sorting quicksort anim frame.svg Utah teapot simple 2.png 3-Tasten-Maus Microsoft.jpg Bei der Informatik handelt es sich um die Wissenschaft von der systematischen Darstellung, Speicherung, Verarbeitung und Übertragung von Daten, wobei besonders die automatische Verarbeitung mit Computern betrachtet wird.

Neu!!: Tokenisierung und Informatik · Mehr sehen »

Information Retrieval

Information Retrieval (IR) betrifft das Wiederauffinden von Information, meist durch Abruf aus Datenbanken.

Neu!!: Tokenisierung und Information Retrieval · Mehr sehen »

Interpunktionszeichen

Der Begriff Interpunktionszeichen wird auf zweierlei Weise verstanden.

Neu!!: Tokenisierung und Interpunktionszeichen · Mehr sehen »

Japanische Schrift

Die japanische Schrift besteht aus mehreren Schriften.

Neu!!: Tokenisierung und Japanische Schrift · Mehr sehen »

Kryptowährung

Kryptowährung bzw.

Neu!!: Tokenisierung und Kryptowährung · Mehr sehen »

Kryptowert

Als Kryptowerte oder Krypto-Assets werden Werte bezeichnet, die "dezentral" organisiert durch Blockchains (''Technik der verteilten Kassenbücher'') abgebildet werden.

Neu!!: Tokenisierung und Kryptowert · Mehr sehen »

Leerzeichen

Das Leerzeichen (auch Leerstelle, Leerschritt, bes. schweiz. Leerschlag, engl. space, blank) dient der Abgrenzung von Wörtern oder anderen Informationen innerhalb eines Textes.

Neu!!: Tokenisierung und Leerzeichen · Mehr sehen »

Parser

Ein Parser („analysieren“, bzw. „Teil“; im Deutschen gelegentlich auch Zerteiler) ist ein Computerprogramm, das in der Informatik für die Zerlegung und Umwandlung einer Eingabe in ein für die Weiterverarbeitung geeigneteres Format zuständig ist.

Neu!!: Tokenisierung und Parser · Mehr sehen »

Programmiersprache

Quelltext eines Programms in der Programmiersprache C++. Scratch. Eine Programmiersprache ist eine formale Sprache zur Formulierung von Datenstrukturen und Algorithmen, d. h.

Neu!!: Tokenisierung und Programmiersprache · Mehr sehen »

Satz (Grammatik)

Ein Satz ist eine aus einem Wort oder mehreren Wörtern bestehende in sich geschlossene sprachliche Einheit.

Neu!!: Tokenisierung und Satz (Grammatik) · Mehr sehen »

Schrift

Das Wort Schrift steht unter anderem für Zeichensysteme zur Bewahrung und Weitergabe von sprachlichen Informationen.

Neu!!: Tokenisierung und Schrift · Mehr sehen »

Segmentierung (Linguistik)

Die Segmentierung (oder Segmentation) ist in der Sprachwissenschaft eine Zerlegung komplexer Einheiten (beispielsweise Sätze oder Wörter) in ihre Elemente (Segmente), die dann wiederum klassifiziert, d. h.

Neu!!: Tokenisierung und Segmentierung (Linguistik) · Mehr sehen »

Springer Spektrum

Springer Spektrum, zuvor Spektrum Akademischer Verlag (SAV), ist ein Fachverlag bzw.

Neu!!: Tokenisierung und Springer Spektrum · Mehr sehen »

Syntaktik

Syntaktik ist diejenige Abteilung der Semiotik (der allgemeinen Zeichenlehre), die mit den Beziehungen eines Zeichens zu anderen Zeichen zu tun hat.

Neu!!: Tokenisierung und Syntaktik · Mehr sehen »

Text

Text (‚weben‘, ‚flechten‘) bezeichnet im nichtwissenschaftlichen Sprachgebrauch eine abgegrenzte, zusammenhängende, meist schriftliche sprachliche Äußerung, im weiteren Sinne auch nicht geschriebene, aber schreibbare Sprachinformation (beispielsweise eines Liedes, Films oder einer improvisierten Theater­aufführung).

Neu!!: Tokenisierung und Text · Mehr sehen »

Text Mining

Text Mining, seltener auch Textmining, Text Data Mining oder Textual Data Mining, ist ein Bündel von Algorithmus-basierten Analyseverfahren zur Entdeckung von Bedeutungsstrukturen aus un- oder schwachstrukturierten Textdaten.

Neu!!: Tokenisierung und Text Mining · Mehr sehen »

Token (Übersetzerbau)

Ein Token (Art.: „das“; Pl.: ‚Tokens‘) ist eine Zeichenkette, der von einer formalen Grammatik ein Typ zugewiesen wird.

Neu!!: Tokenisierung und Token (Übersetzerbau) · Mehr sehen »

Tokenbasierte Kompression

Die tokenbasierte Kompression (englisch token-based compression) ist eine Methode, um bei der Datenverarbeitung Speicherplatz zu sparen.

Neu!!: Tokenisierung und Tokenbasierte Kompression · Mehr sehen »

Trägermedium

Trägermedium sind Medien auf gegenständlichen Trägern mit jedweder Art von Information (Texte, Bilder, Filme oder Töne oder deren Kombination) oder Energie (elektrischer Strom, Erdgas, Wasser) auf gegenständlichen Trägern (Datenträger oder Träger), die zur unmittelbaren Wahrnehmung bestimmt, zum Transport oder zur Weitergabe geeignet oder in einer Vorführ- oder Spielkonsole eingebaut sind.

Neu!!: Tokenisierung und Trägermedium · Mehr sehen »

Trend (Statistik)

Ein Trend ist in der Statistik der Anglizismus für die Veränderung der Daten einer statistischen Zeitreihe, von der angenommen wird, dass sie langfristig und nachhaltig wirkt, die jedoch unabhängig von vorhandenen Fluktuationen oder Volatilitäten eine bestimmte Richtung beibehält.

Neu!!: Tokenisierung und Trend (Statistik) · Mehr sehen »

Vermögensgegenstand

Der Vermögensgegenstand ist ein Rechtsbegriff des Handelsrechts, mit dem alle materiellen und immateriellen bilanzierungsfähigen Sachen und Rechte bezeichnet werden.

Neu!!: Tokenisierung und Vermögensgegenstand · Mehr sehen »

Wertpapierhandel

Als Wertpapierhandel (oder Effektenhandel) wird im Finanzwesen der Handel mit Effekten bezeichnet, der als Börsenhandel oder außerbörslicher Handel stattfinden kann.

Neu!!: Tokenisierung und Wertpapierhandel · Mehr sehen »

Wertpapierrecht

Das Wertpapierrecht ist ein Rechtsgebiet des Privatrechts.

Neu!!: Tokenisierung und Wertpapierrecht · Mehr sehen »

Wertpapierregister

Das Wertpapierregister ist ein elektronisch geführtes Register, in das derzeit Inhaberschuldverschreibungen eingetragen werden, die als elektronisches Wertpapier gelten, weil für sie keine Urkunde ausgestellt ist.

Neu!!: Tokenisierung und Wertpapierregister · Mehr sehen »

Wort

Lateinischer Text ohne erkennbare Wortumbrüche Ein Wort (Plural: Wörter; von althochdeutsch wort „feierlich Gesprochenes“) ist eine selbständige sprachliche Einheit.

Neu!!: Tokenisierung und Wort · Mehr sehen »

AusgehendeEingehende
Hallo! Wir sind auf Facebook! »