Unicode Zeichensuche

Suchen und erkunden Sie Unicode-Zeichen nach Name, Codepunkt oder Kategorie. Finden Sie Emoji, Symbole und Sonderzeichen mit ihren HTML-Entities und CSS-Escape-Codes.

Common Characters

So verwenden Sie Unicode Zeichensuche

  1. 1Suchen Sie nach Zeichennamen (z. B. "snowflake"), Codepunkt (z. B. U+2744) oder fügen Sie ein Zeichen ein.
  2. 2Sehen Sie den Namen, die Kategorie, den Block und die Codierungsdetails des Zeichens.
  3. 3Kopieren Sie die HTML-Entity, den CSS-Escape oder den JavaScript-Escape-Code.
  4. 4Durchsuchen Sie Unicode-Blöcke und -Kategorien.
ZenovayAnalytics

Analytics, für Gründer gebaut.

  • Besucher-Tracking in Echtzeit
  • Datenschutz zuerst, kein Cookie-Banner
  • In zwei Minuten eingerichtet
Zenovay entdecken

Häufig gestellte Fragen

Was ist Unicode?
Unicode ist ein universeller Zeichencodierungsstandard, der jedem Zeichen in jedem Schriftsystem eine eindeutige Nummer (Codepunkt) zuweist. Der Unicode-Standard umfasst 149.813 Zeichen (Unicode 15.1) in 161 Skripten einschließlich Lateinisch, Arabisch, Chinesisch, Japanisch, Koreanisch, Devanagari, Emoji, mathematische Symbole und historische Skripte. Unicode-Codepunkte werden als U+XXXX geschrieben (z.B. U+0041 = A, U+1F600 = 😀). UTF-8, UTF-16 und UTF-32 sind Codierungsformen, die Unicode-Codepunkte als Bytes speichern.
Was ist der Unterschied zwischen Unicode und UTF-8?
Unicode ist der abstrakte Standard (weist Nummern zu Zeichen zu). UTF-8 ist eine konkrete Codierung (konvertiert diese Nummern in Bytes). In UTF-8: ASCII-Zeichen (U+0000 bis U+007F) verwenden 1 Byte; Zeichen bis U+07FF verwenden 2 Bytes; bis U+FFFF verwenden 3 Bytes; bis U+10FFFF verwenden 4 Bytes. UTF-8 ist rückwärtskompatibel mit ASCII und ist die dominante Codierung im Web (~98% der Websites). UTF-16 verwendet 2 oder 4 Bytes pro Zeichen und wird intern von JavaScript und Java verwendet.
Was ist ein Unicode-Codepunkt und wie escape ich ihn?
Ein Codepunkt ist die eindeutige Nummer, die jedem Zeichen zugewiesen ist. U+0041 = dezimal 65 = Buchstabe A. Escape-Formen: HTML-Entity: A oder A (Hex) oder & (benannt). JavaScript: \u0041 (BMP) oder \u{1F600} (vollständiger Bereich, ES2015+). CSS: \41 oder \000041. Python: \u0041 oder \U00001F600. JSON: \u0041 (nur BMP, Surrogate Pairs für andere). URL-Encoding: %41 (Prozent-codiert).
Was ist ein Unicode-Block?
Unicode ist in 308 Blöcke (Unicode 15.1) unterteilt, jeder ein zusammenhängender Bereich von Codepunkten für eine zusammenhängende Zeichengruppe. Beispiele: Basic Latin (U+0000-U+007F), Latin-1 Supplement (U+0080-U+00FF), Greek (U+0370-U+03FF), Cyrillic (U+0400-U+04FF), CJK Unified Ideographs (U+4E00-U+9FFF, 20.902 Zeichen), Emoji (Emoticons Block U+1F600-U+1F64F). Die "Basic Multilingual Plane" (BMP) deckt U+0000 bis U+FFFF ab.
Was sind Unicode-Kategorien?
Unicode weist jedem Zeichen eine General Category zu: L (Buchstabe): Lu=Großbuchstabe, Ll=Kleinbuchstabe, Lt=Titelcase, Lm=Modifizierer, Lo=Sonstiges. N (Zahl): Nd=Dezimalziffer, Nl=Buchstabenzahl, No=Sonstiges. P (Interpunktion): Pc, Pd, Ps, Pe, Pi, Pf, Po. S (Symbol): Sm=Mathematik, Sc=Währung, Sk=Modifizierer, So=Sonstiges. Z (Trennzeichen): Zs=Leerzeichen, Zl=Zeile, Zp=Absatz. C (Sonstiges): Cc=Steuerung, Cf=Format, Cs=Surrogate, Co=Private Use, Cn=nicht zugewiesen.