Búsqueda de Caracteres Unicode
Busca y explora caracteres Unicode por nombre, punto de código o categoría. Encuentra emoji, símbolos y caracteres especiales con sus entidades HTML y códigos de escape CSS.
Common Characters
Cómo usar Búsqueda de Caracteres Unicode
- 1Busca por nombre de carácter (p.ej. "snowflake"), punto de código (p.ej. U+2744) o pega un carácter.
- 2Ve el nombre del carácter, categoría, bloque y detalles de codificación.
- 3Copia la entidad HTML, escape CSS o código de escape JavaScript.
- 4Examina bloques y categorías Unicode.
ZenovayAnalytics
Analytics pensado para fundadores.
- Seguimiento de visitantes en tiempo real
- Privacidad primero, sin aviso de cookies
- Configurado en dos minutos
Herramientas relacionadas
Formateador y Validador JSON
Formatea, valida y embellece datos JSON con resaltado de sintaxis y detección de errores.Decodificador JWT
Decodifica e inspecciona tokens JWT. Consulta el encabezado, la carga útil y verifica firmas.Base64 Codificar/Decodificar
Codifica texto a Base64 o decodifica Base64 a texto. Soporta UTF-8 y datos binarios.Codificador/Decodificador de URL
Codifica o decodifica componentes de URL. Maneja caracteres especiales, cadenas de consulta y URLs completas.Preguntas frecuentes
¿Qué es Unicode?▾
Unicode es un estándar de codificación de caracteres universal que asigna un número único (punto de código) a cada carácter en cada sistema de escritura. El Estándar Unicode cubre 149.813 caracteres (Unicode 15.1) en 161 scripts incluyendo Latino, Árabe, Chino, Japonés, Coreano, Devanagari, Emoji, símbolos matemáticos y escrituras históricas. Los puntos de código Unicode se escriben como U+XXXX (p. ej., U+0041 = A, U+1F600 = 😀). UTF-8, UTF-16 y UTF-32 son formas de codificación que almacenan los puntos de código Unicode como bytes.
¿Cuál es la diferencia entre Unicode y UTF-8?▾
Unicode es el estándar abstracto (asigna números a caracteres). UTF-8 es una codificación concreta (convierte esos números a bytes). En UTF-8: los caracteres ASCII (U+0000 a U+007F) usan 1 byte; los caracteres hasta U+07FF usan 2 bytes; hasta U+FFFF usan 3 bytes; hasta U+10FFFF usan 4 bytes. UTF-8 es compatible con ASCII hacia atrás y la codificación dominante en la web (~98% de los sitios web). UTF-16 usa 2 o 4 bytes por carácter y es usado internamente por JavaScript y Java.
¿Qué es un punto de código Unicode y cómo lo escapo?▾
Un punto de código es el número único asignado a cada carácter. U+0041 = decimal 65 = letra A. Formas de escape: entidad HTML: A o A (hex) o & (con nombre). JavaScript: \u0041 (BMP) o \u{1F600} (rango completo, ES2015+). CSS: \41 o \000041. Python: \u0041 o \U00001F600. JSON: \u0041 (solo BMP, pares sustitutos para los demás). Codificación URL: %41 (codificación porcentual).
¿Qué es un bloque Unicode?▾
Unicode está dividido en 308 bloques (Unicode 15.1), cada uno un rango contiguo de puntos de código para un grupo relacionado de caracteres. Ejemplos: Latino básico (U+0000-U+007F), Suplemento Latino-1 (U+0080-U+00FF), Griego (U+0370-U+03FF), Cirílico (U+0400-U+04FF), Ideogramas Unificados CJK (U+4E00-U+9FFF, 20.902 caracteres), Emoji (bloque Emoticonos U+1F600-U+1F64F). El "Plano Multilingüe Básico" (BMP) cubre U+0000 a U+FFFF.
¿Qué son las categorías Unicode?▾
Unicode asigna a cada carácter una Categoría General: L (Letra): Lu=mayúscula, Ll=minúscula, Lt=título, Lm=modificador, Lo=otro. N (Número): Nd=dígito decimal, Nl=número letra, No=otro. P (Puntuación): Pc, Pd, Ps, Pe, Pi, Pf, Po. S (Símbolo): Sm=matemático, Sc=moneda, Sk=modificador, So=otro. Z (Separador): Zs=espacio, Zl=línea, Zp=párrafo. C (Otro): Cc=control, Cf=formato, Cs=sustituto, Co=uso privado, Cn=sin asignar.