Búsqueda de Caracteres Unicode

Busca y explora caracteres Unicode por nombre, punto de código o categoría. Encuentra emoji, símbolos y caracteres especiales con sus entidades HTML y códigos de escape CSS.

Common Characters

Cómo usar Búsqueda de Caracteres Unicode

  1. 1Busca por nombre de carácter (p.ej. "snowflake"), punto de código (p.ej. U+2744) o pega un carácter.
  2. 2Ve el nombre del carácter, categoría, bloque y detalles de codificación.
  3. 3Copia la entidad HTML, escape CSS o código de escape JavaScript.
  4. 4Examina bloques y categorías Unicode.
ZenovayAnalytics

Analytics pensado para fundadores.

  • Seguimiento de visitantes en tiempo real
  • Privacidad primero, sin aviso de cookies
  • Configurado en dos minutos
Descubre Zenovay

Preguntas frecuentes

¿Qué es Unicode?
Unicode es un estándar de codificación de caracteres universal que asigna un número único (punto de código) a cada carácter en cada sistema de escritura. El Estándar Unicode cubre 149.813 caracteres (Unicode 15.1) en 161 scripts incluyendo Latino, Árabe, Chino, Japonés, Coreano, Devanagari, Emoji, símbolos matemáticos y escrituras históricas. Los puntos de código Unicode se escriben como U+XXXX (p. ej., U+0041 = A, U+1F600 = 😀). UTF-8, UTF-16 y UTF-32 son formas de codificación que almacenan los puntos de código Unicode como bytes.
¿Cuál es la diferencia entre Unicode y UTF-8?
Unicode es el estándar abstracto (asigna números a caracteres). UTF-8 es una codificación concreta (convierte esos números a bytes). En UTF-8: los caracteres ASCII (U+0000 a U+007F) usan 1 byte; los caracteres hasta U+07FF usan 2 bytes; hasta U+FFFF usan 3 bytes; hasta U+10FFFF usan 4 bytes. UTF-8 es compatible con ASCII hacia atrás y la codificación dominante en la web (~98% de los sitios web). UTF-16 usa 2 o 4 bytes por carácter y es usado internamente por JavaScript y Java.
¿Qué es un punto de código Unicode y cómo lo escapo?
Un punto de código es el número único asignado a cada carácter. U+0041 = decimal 65 = letra A. Formas de escape: entidad HTML: A o A (hex) o & (con nombre). JavaScript: \u0041 (BMP) o \u{1F600} (rango completo, ES2015+). CSS: \41 o \000041. Python: \u0041 o \U00001F600. JSON: \u0041 (solo BMP, pares sustitutos para los demás). Codificación URL: %41 (codificación porcentual).
¿Qué es un bloque Unicode?
Unicode está dividido en 308 bloques (Unicode 15.1), cada uno un rango contiguo de puntos de código para un grupo relacionado de caracteres. Ejemplos: Latino básico (U+0000-U+007F), Suplemento Latino-1 (U+0080-U+00FF), Griego (U+0370-U+03FF), Cirílico (U+0400-U+04FF), Ideogramas Unificados CJK (U+4E00-U+9FFF, 20.902 caracteres), Emoji (bloque Emoticonos U+1F600-U+1F64F). El "Plano Multilingüe Básico" (BMP) cubre U+0000 a U+FFFF.
¿Qué son las categorías Unicode?
Unicode asigna a cada carácter una Categoría General: L (Letra): Lu=mayúscula, Ll=minúscula, Lt=título, Lm=modificador, Lo=otro. N (Número): Nd=dígito decimal, Nl=número letra, No=otro. P (Puntuación): Pc, Pd, Ps, Pe, Pi, Pf, Po. S (Símbolo): Sm=matemático, Sc=moneda, Sk=modificador, So=otro. Z (Separador): Zs=espacio, Zl=línea, Zp=párrafo. C (Otro): Cc=control, Cf=formato, Cs=sustituto, Co=uso privado, Cn=sin asignar.