Busca de Caracteres Unicode

Pesquise e explore caracteres Unicode por nome, ponto de código ou categoria. Encontre emoji, símbolos e caracteres especiais com suas entidades HTML e códigos de escape CSS.

Search by name, codepoint (U+2764), or paste a character

Common Characters

Como Usar Busca de Caracteres Unicode

1Pesquise por nome do caractere (ex: "snowflake"), ponto de código (ex: U+2744) ou cole um caractere.
2Veja o nome do caractere, categoria, bloco e detalhes de codificação.
3Copie a entidade HTML, escape CSS ou código de escape JavaScript.
4Navegue pelos blocos e categorias Unicode.

ZenovayAnalytics

Analytics feito para fundadores.

Acompanhamento de visitantes em tempo real
Privacidade em primeiro lugar, sem banner de cookies
Configurado em dois minutos

Conheça o Zenovay

Ferramentas Relacionadas

Formatador e Validador de JSON

Formate, valide e embeleze dados JSON com destaque de sintaxe e detecção de erros.

Decodificador JWT

Decodifique e inspecione tokens JWT. Visualize cabeçalho, payload e verifique assinaturas.

Codificar/Decodificar Base64

Codifique texto para Base64 ou decodifique Base64 de volta para texto. Suporta dados UTF-8 e binários.

Encode/Decode de URL

Codifique ou decodifique componentes de URL. Trate caracteres especiais, strings de consulta e URLs completas.

Perguntas Frequentes

O que é Unicode?▾

Unicode é um padrão de codificação de caracteres universal que atribui um número único (codepoint) a cada caractere em cada sistema de escrita. O Padrão Unicode cobre 149.813 caracteres (Unicode 15.1) em 161 scripts incluindo Latin, Árabe, Chinês, Japonês, Coreano, Devanagari, Emoji, símbolos matemáticos e scripts históricos. Codepoints Unicode são escritos como U+XXXX (por exemplo, U+0041 = A, U+1F600 = 😀). UTF-8, UTF-16 e UTF-32 são formas de codificação que armazenam codepoints Unicode como bytes.

Qual é a diferença entre Unicode e UTF-8?▾

Unicode é o padrão abstrato (atribui números a caracteres). UTF-8 é uma codificação concreta (converte esses números em bytes). Em UTF-8: caracteres ASCII (U+0000 para U+007F) usam 1 byte; caracteres até U+07FF usam 2 bytes; até U+FFFF usam 3 bytes; até U+10FFFF usam 4 bytes. UTF-8 é compatível com versões anteriores de ASCII e é a codificação dominante na web (~98% dos sites). UTF-16 usa 2 ou 4 bytes por caractere e é usado internamente por JavaScript e Java.

O que é um codepoint Unicode e como faço escape dele?▾

Um codepoint é o número único atribuído a cada caractere. U+0041 = decimal 65 = letra A. Formas de escape: entidade HTML: A ou A (hex) ou & (nomeada). JavaScript: \u0041 (BMP) ou \u{1F600} (faixa completa, ES2015+). CSS: \41 ou \000041. Python: \u0041 ou \U00001F600. JSON: \u0041 (apenas BMP, pares substitutos para outros). Codificação de URL: %41 (percent-encoded).

O que é um bloco Unicode?▾

Unicode é dividido em 308 blocos (Unicode 15.1), cada um um intervalo contíguo de codepoints para um grupo relacionado de caracteres. Exemplos: Basic Latin (U+0000-U+007F), Latin-1 Supplement (U+0080-U+00FF), Greek (U+0370-U+03FF), Cyrillic (U+0400-U+04FF), CJK Unified Ideographs (U+4E00-U+9FFF, 20.902 caracteres), Emoji (bloco Emoticons U+1F600-U+1F64F). O "Basic Multilingual Plane" (BMP) cobre U+0000 até U+FFFF.

O que são categorias Unicode?▾

Unicode atribui a cada caractere uma Categoria Geral: L (Letra): Lu=maiúscula, Ll=minúscula, Lt=titlecase, Lm=modificador, Lo=outro. N (Número): Nd=dígito decimal, Nl=número de letra, No=outro. P (Pontuação): Pc, Pd, Ps, Pe, Pi, Pf, Po. S (Símbolo): Sm=matemática, Sc=moeda, Sk=modificador, So=outro. Z (Separador): Zs=espaço, Zl=linha, Zp=parágrafo. C (Outro): Cc=controle, Cf=formato, Cs=substituto, Co=uso privado, Cn=não atribuído.