Unicode Zeichensuche
Suchen und erkunden Sie Unicode-Zeichen nach Name, Codepunkt oder Kategorie. Finden Sie Emoji, Symbole und Sonderzeichen mit ihren HTML-Entities und CSS-Escape-Codes.
Common Characters
So verwenden Sie Unicode Zeichensuche
- 1Suchen Sie nach Zeichennamen (z. B. "snowflake"), Codepunkt (z. B. U+2744) oder fügen Sie ein Zeichen ein.
- 2Sehen Sie den Namen, die Kategorie, den Block und die Codierungsdetails des Zeichens.
- 3Kopieren Sie die HTML-Entity, den CSS-Escape oder den JavaScript-Escape-Code.
- 4Durchsuchen Sie Unicode-Blöcke und -Kategorien.
ZenovayAnalytics
Analytics, für Gründer gebaut.
- Besucher-Tracking in Echtzeit
- Datenschutz zuerst, kein Cookie-Banner
- In zwei Minuten eingerichtet
Verwandte Tools
JSON-Formatter und Validator
Formatieren, validieren und verschönern Sie JSON-Daten mit Syntaxhervorhebung und Fehlererkennung.JWT-Decoder
Dekodieren und inspizieren Sie JWT-Token. Zeigen Sie Header, Payload und überprüfen Sie Signaturen.Base64 Encode/Decode
Kodieren Sie Text in Base64 oder dekodieren Sie Base64 zurück in Text. Unterstützt UTF-8 und Binärdaten.URL Codierungstool
Codieren oder decodieren Sie URL-Komponenten. Verarbeiten Sie Sonderzeichen, Abfragezeichenfolgen und vollständige URLs.Häufig gestellte Fragen
Was ist Unicode?▾
Unicode ist ein universeller Zeichencodierungsstandard, der jedem Zeichen in jedem Schriftsystem eine eindeutige Nummer (Codepunkt) zuweist. Der Unicode-Standard umfasst 149.813 Zeichen (Unicode 15.1) in 161 Skripten einschließlich Lateinisch, Arabisch, Chinesisch, Japanisch, Koreanisch, Devanagari, Emoji, mathematische Symbole und historische Skripte. Unicode-Codepunkte werden als U+XXXX geschrieben (z.B. U+0041 = A, U+1F600 = 😀). UTF-8, UTF-16 und UTF-32 sind Codierungsformen, die Unicode-Codepunkte als Bytes speichern.
Was ist der Unterschied zwischen Unicode und UTF-8?▾
Unicode ist der abstrakte Standard (weist Nummern zu Zeichen zu). UTF-8 ist eine konkrete Codierung (konvertiert diese Nummern in Bytes). In UTF-8: ASCII-Zeichen (U+0000 bis U+007F) verwenden 1 Byte; Zeichen bis U+07FF verwenden 2 Bytes; bis U+FFFF verwenden 3 Bytes; bis U+10FFFF verwenden 4 Bytes. UTF-8 ist rückwärtskompatibel mit ASCII und ist die dominante Codierung im Web (~98% der Websites). UTF-16 verwendet 2 oder 4 Bytes pro Zeichen und wird intern von JavaScript und Java verwendet.
Was ist ein Unicode-Codepunkt und wie escape ich ihn?▾
Ein Codepunkt ist die eindeutige Nummer, die jedem Zeichen zugewiesen ist. U+0041 = dezimal 65 = Buchstabe A. Escape-Formen: HTML-Entity: A oder A (Hex) oder & (benannt). JavaScript: \u0041 (BMP) oder \u{1F600} (vollständiger Bereich, ES2015+). CSS: \41 oder \000041. Python: \u0041 oder \U00001F600. JSON: \u0041 (nur BMP, Surrogate Pairs für andere). URL-Encoding: %41 (Prozent-codiert).
Was ist ein Unicode-Block?▾
Unicode ist in 308 Blöcke (Unicode 15.1) unterteilt, jeder ein zusammenhängender Bereich von Codepunkten für eine zusammenhängende Zeichengruppe. Beispiele: Basic Latin (U+0000-U+007F), Latin-1 Supplement (U+0080-U+00FF), Greek (U+0370-U+03FF), Cyrillic (U+0400-U+04FF), CJK Unified Ideographs (U+4E00-U+9FFF, 20.902 Zeichen), Emoji (Emoticons Block U+1F600-U+1F64F). Die "Basic Multilingual Plane" (BMP) deckt U+0000 bis U+FFFF ab.
Was sind Unicode-Kategorien?▾
Unicode weist jedem Zeichen eine General Category zu: L (Buchstabe): Lu=Großbuchstabe, Ll=Kleinbuchstabe, Lt=Titelcase, Lm=Modifizierer, Lo=Sonstiges. N (Zahl): Nd=Dezimalziffer, Nl=Buchstabenzahl, No=Sonstiges. P (Interpunktion): Pc, Pd, Ps, Pe, Pi, Pf, Po. S (Symbol): Sm=Mathematik, Sc=Währung, Sk=Modifizierer, So=Sonstiges. Z (Trennzeichen): Zs=Leerzeichen, Zl=Zeile, Zp=Absatz. C (Sonstiges): Cc=Steuerung, Cf=Format, Cs=Surrogate, Co=Private Use, Cn=nicht zugewiesen.