Recherche de caractères Unicode
Recherchez et explorez les caractères Unicode par nom, codepoint ou catégorie. Trouvez des emoji, des symboles et des caractères spéciaux avec leurs entités HTML et codes d'échappement CSS.
Common Characters
Comment utiliser Recherche de caractères Unicode
- 1Recherchez par nom de caractère (par ex. « snowflake »), codepoint (par ex. U+2744) ou collez un caractère.
- 2Voyez le nom du caractère, la catégorie, le bloc et les détails d'encodage.
- 3Copiez l'entité HTML, l'échappement CSS ou le code d'échappement JavaScript.
- 4Parcourez les blocs et les catégories Unicode.
ZenovayAnalytics
Analytics pensé pour les fondateurs.
- Suivi des visiteurs en temps réel
- Vie privée d'abord, sans bandeau cookies
- Installé en deux minutes
Outils connexes
Formateur et Validateur JSON
Formatez, validez et embellissez les données JSON avec la coloration syntaxique et la détection d'erreurs.Décodeur JWT
Décodez et inspectez les jetons JWT. Consultez l'en-tête, la charge utile et vérifiez les signatures.Encodeur/Décodeur Base64
Encodez du texte en Base64 ou décodez Base64 en texte. Supporte UTF-8 et les données binaires.Encodage / Décodage URL
Encodez ou décodez les composants URL. Traitez les caractères spéciaux, les chaînes de requête et les URL complètes.Questions fréquemment posées
Qu'est-ce que Unicode ?▾
Unicode est une norme de codage de caractères universel qui attribue un numéro unique (point de code) à chaque caractère dans chaque système d'écriture. La norme Unicode couvre 149 813 caractères (Unicode 15.1) sur 161 scripts, notamment Latin, Arabe, Chinois, Japonais, Coréen, Devanagari, Emoji, symboles mathématiques et scripts historiques. Les points de code Unicode sont écrits comme U+XXXX (par exemple, U+0041 = A, U+1F600 = 😀). UTF-8, UTF-16 et UTF-32 sont des formes d'encodage qui stockent les points de code Unicode sous forme d'octets.
Quelle est la différence entre Unicode et UTF-8 ?▾
Unicode est la norme abstraite (assigne des nombres aux caractères). UTF-8 est un encodage concret (convertit ces nombres en octets). En UTF-8 : les caractères ASCII (U+0000 à U+007F) utilisent 1 octet ; les caractères jusqu'à U+07FF utilisent 2 octets ; jusqu'à U+FFFF utilisent 3 octets ; jusqu'à U+10FFFF utilisent 4 octets. UTF-8 est rétro-compatible avec ASCII et l'encodage dominant sur le web (~98% des sites web). UTF-16 utilise 2 ou 4 octets par caractère et est utilisé en interne par JavaScript et Java.
Qu'est-ce qu'un point de code Unicode et comment l'échapper ?▾
Un point de code est le numéro unique attribué à chaque caractère. U+0041 = décimal 65 = lettre A. Formes d'échappement : entité HTML : A ou A (hex) ou & (nommée). JavaScript : \u0041 (BMP) ou \u{1F600} (plage complète, ES2015+). CSS : \41 ou \000041. Python : \u0041 ou \U00001F600. JSON : \u0041 (BMP uniquement, paires de substitution pour les autres). Encodage URL : %41 (codé en pourcentage).
Qu'est-ce qu'un bloc Unicode ?▾
Unicode est divisé en 308 blocs (Unicode 15.1), chacun étant une plage contiguë de points de code pour un groupe de caractères connexes. Exemples : Latin de base (U+0000-U+007F), Supplément Latin-1 (U+0080-U+00FF), Grec (U+0370-U+03FF), Cyrillique (U+0400-U+04FF), Idéogrammes CJK unifiés (U+4E00-U+9FFF, 20 902 caractères), Emoji (bloc Emoticons U+1F600-U+1F64F). Le « Plan multilingue de base » (BMP) couvre U+0000 à U+FFFF.
Quelles sont les catégories Unicode ?▾
Unicode assigne à chaque caractère une catégorie générale : L (Lettre) : Lu=majuscule, Ll=minuscule, Lt=casse titre, Lm=modificateur, Lo=autre. N (Nombre) : Nd=chiffre décimal, Nl=numéro de lettre, No=autre. P (Ponctuation) : Pc, Pd, Ps, Pe, Pi, Pf, Po. S (Symbole) : Sm=math, Sc=devise, Sk=modificateur, So=autre. Z (Séparateur) : Zs=espace, Zl=ligne, Zp=paragraphe. C (Autre) : Cc=contrôle, Cf=format, Cs=substitut, Co=utilisation privée, Cn=non attribué.