Búsqueda de Caracteres Unicode

Busca y explora caracteres Unicode por nombre, punto de código o categoría. Encuentra emoji, símbolos y caracteres especiales con sus entidades HTML y códigos de escape CSS.

Search by name, codepoint (U+2764), or paste a character

Common Characters

Cómo usar Búsqueda de Caracteres Unicode

1Busca por nombre de carácter (p.ej. "snowflake"), punto de código (p.ej. U+2744) o pega un carácter.
2Ve el nombre del carácter, categoría, bloque y detalles de codificación.
3Copia la entidad HTML, escape CSS o código de escape JavaScript.
4Examina bloques y categorías Unicode.

ZenovayAnalytics

Analytics pensado para fundadores.

Seguimiento de visitantes en tiempo real
Privacidad primero, sin aviso de cookies
Configurado en dos minutos

Descubre Zenovay

Herramientas relacionadas

Formateador y Validador JSON

Formatea, valida y embellece datos JSON con resaltado de sintaxis y detección de errores.

Decodificador JWT

Decodifica e inspecciona tokens JWT. Consulta el encabezado, la carga útil y verifica firmas.

Base64 Codificar/Decodificar

Codifica texto a Base64 o decodifica Base64 a texto. Soporta UTF-8 y datos binarios.

Codificador/Decodificador de URL

Codifica o decodifica componentes de URL. Maneja caracteres especiales, cadenas de consulta y URLs completas.

Preguntas frecuentes

¿Qué es Unicode?▾

Unicode es un estándar de codificación de caracteres universal que asigna un número único (punto de código) a cada carácter en cada sistema de escritura. El Estándar Unicode cubre 149.813 caracteres (Unicode 15.1) en 161 scripts incluyendo Latino, Árabe, Chino, Japonés, Coreano, Devanagari, Emoji, símbolos matemáticos y escrituras históricas. Los puntos de código Unicode se escriben como U+XXXX (p. ej., U+0041 = A, U+1F600 = 😀). UTF-8, UTF-16 y UTF-32 son formas de codificación que almacenan los puntos de código Unicode como bytes.

¿Cuál es la diferencia entre Unicode y UTF-8?▾

Unicode es el estándar abstracto (asigna números a caracteres). UTF-8 es una codificación concreta (convierte esos números a bytes). En UTF-8: los caracteres ASCII (U+0000 a U+007F) usan 1 byte; los caracteres hasta U+07FF usan 2 bytes; hasta U+FFFF usan 3 bytes; hasta U+10FFFF usan 4 bytes. UTF-8 es compatible con ASCII hacia atrás y la codificación dominante en la web (~98% de los sitios web). UTF-16 usa 2 o 4 bytes por carácter y es usado internamente por JavaScript y Java.

¿Qué es un punto de código Unicode y cómo lo escapo?▾

Un punto de código es el número único asignado a cada carácter. U+0041 = decimal 65 = letra A. Formas de escape: entidad HTML: A o A (hex) o & (con nombre). JavaScript: \u0041 (BMP) o \u{1F600} (rango completo, ES2015+). CSS: \41 o \000041. Python: \u0041 o \U00001F600. JSON: \u0041 (solo BMP, pares sustitutos para los demás). Codificación URL: %41 (codificación porcentual).

¿Qué es un bloque Unicode?▾

Unicode está dividido en 308 bloques (Unicode 15.1), cada uno un rango contiguo de puntos de código para un grupo relacionado de caracteres. Ejemplos: Latino básico (U+0000-U+007F), Suplemento Latino-1 (U+0080-U+00FF), Griego (U+0370-U+03FF), Cirílico (U+0400-U+04FF), Ideogramas Unificados CJK (U+4E00-U+9FFF, 20.902 caracteres), Emoji (bloque Emoticonos U+1F600-U+1F64F). El "Plano Multilingüe Básico" (BMP) cubre U+0000 a U+FFFF.

¿Qué son las categorías Unicode?▾

Unicode asigna a cada carácter una Categoría General: L (Letra): Lu=mayúscula, Ll=minúscula, Lt=título, Lm=modificador, Lo=otro. N (Número): Nd=dígito decimal, Nl=número letra, No=otro. P (Puntuación): Pc, Pd, Ps, Pe, Pi, Pf, Po. S (Símbolo): Sm=matemático, Sc=moneda, Sk=modificador, So=otro. Z (Separador): Zs=espacio, Zl=línea, Zp=párrafo. C (Otro): Cc=control, Cf=formato, Cs=sustituto, Co=uso privado, Cn=sin asignar.