Logo
Unionpedia
Kommunikation
Jetzt bei Google Play
Neu! Laden Sie Unionpedia auf Ihrem Android™-Gerät herunter!
Frei
Schneller Zugriff als Browser!
 

Normalisierung (Unicode)

Index Normalisierung (Unicode)

Der Unicode-Standard kennt unterschiedliche Normalformen von Unicode-Zeichenketten und Algorithmen zur Normalisierung, also zur Überführung einer Zeichenkette in eine solche Normalform.

39 Beziehungen: Algorithmus, American Standard Code for Information Interchange, Arabisch und Syrisch in Unicode, Ångström (Einheit), Bruchrechnung, Buchstabe mit Doppelstrich, Byte, Dekomposition, Diakritisches Zeichen, Effizienz (Informatik), Extensible Markup Language, Geschütztes Leerzeichen, Hochstellung, Hypertext Markup Language, Idempotenz, ISO 8859-1, Jamo, JavaScript, Kombinierendes Zeichen, Kompatibilität (Technik), Leerzeichen, Ligatur (Typografie), Liste der Unicode-Eigenschaften, My, Normalisierung (Text), Persistenz (Informatik), Schriftart, Tiefstellung, Trema, Typografie, Unicode, Unicode Collation Algorithm, Unicode-Zeilenumbruch-Algorithmus, Unicodeblock Hangeul-Silbenzeichen, Unicodeblock Umschlossene alphanumerische Zeichen, World Wide Web Consortium, Zeichenkette, Zeichenkodierung, Zeilenumbruch.

Algorithmus

sowjetischen Briefmarke anlässlich seines 1200-jährigen Geburtsjubiläums Ein Algorithmus (benannt nach al-Chwarizmi, von arabisch: Choresmier) ist eine eindeutige Handlungsvorschrift zur Lösung eines Problems oder einer Klasse von Problemen.

Neu!!: Normalisierung (Unicode) und Algorithmus · Mehr sehen »

American Standard Code for Information Interchange

ASCII-Tabelle aus MIL-STD-188-100 (1972) Der American Standard Code for Information Interchange (ASCII, alternativ US-ASCII, ausgesprochen) ist eine 7-Bit-Zeichenkodierung; sie entspricht der US-Variante von ISO 646 und dient als Grundlage für spätere, auf mehr Bits basierende Kodierungen für Zeichensätze.

Neu!!: Normalisierung (Unicode) und American Standard Code for Information Interchange · Mehr sehen »

Arabisch und Syrisch in Unicode

Die Zeichen für das Arabische und Syrische befinden sich in Unicode in acht verschiedenen Unicode-Blöcken.

Neu!!: Normalisierung (Unicode) und Arabisch und Syrisch in Unicode · Mehr sehen »

Ångström (Einheit)

Das Ångström (nach dem schwedischen Physiker Anders Jonas Ångström) ist eine Maßeinheit der Länge.

Neu!!: Normalisierung (Unicode) und Ångström (Einheit) · Mehr sehen »

Bruchrechnung

Im engeren Sinn bezeichnet Bruchrechnung das Rechnen mit gemeinen Brüchen (manchmal auch gewöhnlichen Brüchen) in der „Zähler-Bruchstrich-Nenner-Schreibweise“ (siehe unten).

Neu!!: Normalisierung (Unicode) und Bruchrechnung · Mehr sehen »

Buchstabe mit Doppelstrich

Einige der grundlegenden Zahlen­mengen werden häufig durch Buch­staben mit Doppelstrich bezeichnet. Bei Buchstaben mit Doppelstrich, auch lichte Buchstaben genannt, werden einer oder mehrere Striche des Buchstabens – häufig ein senkrechter – doppelt nachgezeichnet.

Neu!!: Normalisierung (Unicode) und Buchstabe mit Doppelstrich · Mehr sehen »

Byte

Das Byte (wohl gebildet zu „Bit“) – Duden, Bibliographisches Institut, 2016 ist eine Maßeinheit der Digitaltechnik und der Informatik, das meist für eine Folge aus 8 Bit steht.

Neu!!: Normalisierung (Unicode) und Byte · Mehr sehen »

Dekomposition

Dekomposition (von lateinisch decompositio ‚Zerlegung‘) steht für.

Neu!!: Normalisierung (Unicode) und Dekomposition · Mehr sehen »

Diakritisches Zeichen

Diakritische Zeichen oder Diakritika (Singular Diakritikum, Diakritikon; zu) sind an Buchstaben angebrachte kleine Zeichen wie Punkte, Striche, Häkchen, Bögen oder Kreise, die eine vom unmarkierten Buchstaben abweichende Aussprache oder Betonung anzeigen und die dem Buchstaben über- oder untergesetzt, aber auch vor- oder nachgestellt sind und in einigen Fällen durch den Buchstaben gehen.

Neu!!: Normalisierung (Unicode) und Diakritisches Zeichen · Mehr sehen »

Effizienz (Informatik)

Die Effizienz eines Algorithmus ist seine Sparsamkeit bezüglich Ressourcen, Rechenzeit und Speicherplatz, die jener zur Lösung eines festgelegten Problems beansprucht.

Neu!!: Normalisierung (Unicode) und Effizienz (Informatik) · Mehr sehen »

Extensible Markup Language

Die Extensible Markup Language (dt. Erweiterbare Auszeichnungssprache), abgekürzt XML, ist eine Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten im Format einer Textdatei, die sowohl von Menschen als auch von Maschinen lesbar ist.

Neu!!: Normalisierung (Unicode) und Extensible Markup Language · Mehr sehen »

Geschütztes Leerzeichen

Ein geschütztes LeerzeichenBenennung laut DIN 5009:2022-06 Beiblatt 1, Tabelle 15 „Allgemein verwendete Leerzeichen“ (auch non-breaking space, abgekürzt NBSP, manchmal auch als Dauerleerzeichen bezeichnet) verhindert einen automatischen Zeilenumbruch an der Position des Leerzeichens, der die Leserlichkeit verschlechtern und den Lesefluss stören könnte.

Neu!!: Normalisierung (Unicode) und Geschütztes Leerzeichen · Mehr sehen »

Hochstellung

Die Hochstellung ist ein graphisches Gestaltungsmittel im Schriftsatz, bei dem Buchstaben oder Zahlen gegenüber dem normalen Text hochgestellt werden.

Neu!!: Normalisierung (Unicode) und Hochstellung · Mehr sehen »

Hypertext Markup Language

Die Hypertext Markup Language (HTML, für Hypertext-Auszeichnungssprache) ist eine textbasierte Auszeichnungssprache zur Strukturierung elektronischer Dokumente wie Texte mit Hyperlinks, Bildern und anderen Inhalten.

Neu!!: Normalisierung (Unicode) und Hypertext Markup Language · Mehr sehen »

Idempotenz

Idempotenz ist eine Bezeichnung aus der Mathematik und Informatik.

Neu!!: Normalisierung (Unicode) und Idempotenz · Mehr sehen »

ISO 8859-1

ISO 8859-1, genauer ISO/IEC 8859-1, auch bekannt als Latin-1, ist ein von der ISO zuletzt 1998 aktualisierter Standard für die Informationstechnik zur Zeichenkodierung mit acht Bit und der erste Teil der Normenfamilie ISO 8859.

Neu!!: Normalisierung (Unicode) und ISO 8859-1 · Mehr sehen »

Jamo

Die 51 jamo (wörtlich „Mütter der Buchstaben/Schriftzeichen“, auch 낱자 natja genannt) sind die im 15. Jahrhundert geschaffenen Buchstaben einer Hangeul genannten Alphabetschrift, die heute zum Schreiben des Koreanischen verwendet wird.

Neu!!: Normalisierung (Unicode) und Jamo · Mehr sehen »

JavaScript

JavaScript (kurz JS) ist eine Skriptsprache, die ursprünglich 1995 von Netscape für dynamisches HTML in Webbrowsern entwickelt wurde, um Benutzerinteraktionen auszuwerten, Inhalte zu verändern, nachzuladen oder zu generieren und so die Möglichkeiten von HTML zu erweitern.

Neu!!: Normalisierung (Unicode) und JavaScript · Mehr sehen »

Kombinierendes Zeichen

y mit Breve Kombinierende Zeichen sind in der digitalen Typografie besondere Zeichen, die normalerweise nicht einzeln dargestellt werden, sondern mit dem vorhergehenden Zeichen zu einem einzigen Zeichen verbunden werden.

Neu!!: Normalisierung (Unicode) und Kombinierendes Zeichen · Mehr sehen »

Kompatibilität (Technik)

Kompatibilität liegt in der Technik vor, wenn zwei oder mehr Produkte gegenseitig so koordiniert sind, dass sie störungsfrei miteinander funktionieren können und einem Nachfrager einen Nutzen stiften.

Neu!!: Normalisierung (Unicode) und Kompatibilität (Technik) · Mehr sehen »

Leerzeichen

Das Leerzeichen (auch Leerstelle, Leerschritt, bes. schweiz. Leerschlag, engl. space, blank) dient der Abgrenzung von Wörtern oder anderen Informationen innerhalb eines Textes.

Neu!!: Normalisierung (Unicode) und Leerzeichen · Mehr sehen »

Ligatur (Typografie)

Garamond Futura schmalfett) Eine Ligatur (von mittellateinisch ligatura ‚Verbindung‘, zu ligare ‚binden, verbinden‘) oder Buchstabenverbund bezeichnet in der Typografie solche Glyphen, die aus der Verschmelzung zweier oder mehrerer Buchstaben (Graphen) einer Satzschrift entstanden sind.

Neu!!: Normalisierung (Unicode) und Ligatur (Typografie) · Mehr sehen »

Liste der Unicode-Eigenschaften

Der Unicode-Standard kodiert nicht nur eine sehr große Zahl von Zeichen, sondern legt zu jedem dieser Zeichen auch eine Reihe von Eigenschaften fest, die das Zeichen und sein Verhalten beschreiben.

Neu!!: Normalisierung (Unicode) und Liste der Unicode-Eigenschaften · Mehr sehen »

My

My (altgriechisches Neutrum μῦ und mi; Majuskel: Μ, Minuskel: μ) ist der 12. Buchstabe des griechischen Alphabets und hat nach dem milesischen System den Zahlwert 40.

Neu!!: Normalisierung (Unicode) und My · Mehr sehen »

Normalisierung (Text)

Unter Normalisierung von Text versteht man das Überführen in eine andere Form, bei der nur die für den gewünschten Kontext relevanten Informationen beibehalten werden.

Neu!!: Normalisierung (Unicode) und Normalisierung (Text) · Mehr sehen »

Persistenz (Informatik)

Persistenz (von lateinisch persistere „verharren, stehen bleiben“) ist ein wesentlicher Begriff in der Informatik, der die Fähigkeit eines Systems beschreibt, den Zustand seiner Daten (persistente Daten, transiente Daten), Objektmodelle oder logischen Verbindungen über längere Zeiträume hinweg zu bewahren.

Neu!!: Normalisierung (Unicode) und Persistenz (Informatik) · Mehr sehen »

Schriftart

Als Schriftart bzw.

Neu!!: Normalisierung (Unicode) und Schriftart · Mehr sehen »

Tiefstellung

Eine Tiefstellung (auch Subskript von lateinisch sub, "unter" und scriptum „geschrieben“) ist eine Zahl, ein Buchstabe oder ein anderes Zeichen, das unterhalb der normalen Druckzeile geschrieben wird.

Neu!!: Normalisierung (Unicode) und Tiefstellung · Mehr sehen »

Trema

Das Trema (Plural: Tremas oder Tremata nach griechisch trémata), auch Zweipunktakzent, ist ein diakritisches Zeichen in Form zweier horizontal angeordneter Punkte über einem Buchstaben.

Neu!!: Normalisierung (Unicode) und Trema · Mehr sehen »

Typografie

bürgerlich-konservative Ausrichtung des Blatts, die Antiqua darunter als Gegenpol Aktualität und Modernität ausdrücken. Typografie (vom Duden und der schweizerischen Bundeskanzlei empfohlene Schreibweise) oder Typographie (von „Schlag, Abdruck, Figur, Typ“ und -graphie) ist eine mehrdeutige Bezeichnung: Im traditionellen Sinne bezieht sie sich auf die Gestaltung von Druckwerken mit beweglichen Lettern (Typen).

Neu!!: Normalisierung (Unicode) und Typografie · Mehr sehen »

Unicode

Logo von Unicode Der Unicode-Standard (Aussprachen: amerikanisches Englisch, britisches Englisch; dt.) legt fest, wie Schrift elektronisch gespeichert wird, z. B.

Neu!!: Normalisierung (Unicode) und Unicode · Mehr sehen »

Unicode Collation Algorithm

Der Unicode Collation Algorithm (kurz UCA) ist der vom Unicode-Konsortium veröffentlichte Algorithmus, um Zeichenketten aus Unicode-Zeichen zu vergleichen und so alphabetisch zu ordnen.

Neu!!: Normalisierung (Unicode) und Unicode Collation Algorithm · Mehr sehen »

Unicode-Zeilenumbruch-Algorithmus

Der Unicode-Zeilenumbruch-Algorithmus ist der vom Unicode-Konsortium veröffentlichte Algorithmus für den Zeilenumbruch.

Neu!!: Normalisierung (Unicode) und Unicode-Zeilenumbruch-Algorithmus · Mehr sehen »

Unicodeblock Hangeul-Silbenzeichen

Der Unicodeblock Hangeul-Silbenzeichen (engl. Hangul Syllables, U+AC00 bis U+D7AF) enthält alle Silbenzeichen der Hangeul genannten koreanischen Schrift.

Neu!!: Normalisierung (Unicode) und Unicodeblock Hangeul-Silbenzeichen · Mehr sehen »

Unicodeblock Umschlossene alphanumerische Zeichen

Der Unicodeblock Umschlossene alphanumerische Zeichen (engl. Enclosed Alphanumerics, U+2460 bis U+24FF) enthält Ordinalzahlen bis 20 sowie eingeklammerte und eingekreiste Zahlen bis 20 und lateinische Groß- und Kleinbuchstaben.

Neu!!: Normalisierung (Unicode) und Unicodeblock Umschlossene alphanumerische Zeichen · Mehr sehen »

World Wide Web Consortium

Das World Wide Web Consortium (kurz W3C) ist das Gremium zur Standardisierung der Techniken im World Wide Web.

Neu!!: Normalisierung (Unicode) und World Wide Web Consortium · Mehr sehen »

Zeichenkette

Eine Zeichenkette, Zeichenfolge, Zeichenreihe oder ein String (aus dem Englischen) ist in der Informatik eine endliche Folge von Zeichen (z. B. Buchstaben, Ziffern, Sonderzeichen und Steuerzeichen) aus einem definierten Zeichensatz.

Neu!!: Normalisierung (Unicode) und Zeichenkette · Mehr sehen »

Zeichenkodierung

Eine Zeichenkodierung (kurz Encoding) erlaubt die eindeutige Zuordnung von Schriftzeichen (i. A. Buchstaben oder Ziffern) und Symbolen innerhalb eines Zeichensatzes.

Neu!!: Normalisierung (Unicode) und Zeichenkodierung · Mehr sehen »

Zeilenumbruch

Der Begriff Zeilenumbruch stammt aus der elektronischen Textverarbeitung und gibt an, an welcher Stelle ein Text von einer Zeile in die nächste übergehen soll.

Neu!!: Normalisierung (Unicode) und Zeilenumbruch · Mehr sehen »

Leitet hier um:

NFKC.

AusgehendeEingehende
Hallo! Wir sind auf Facebook! »