Busca de Caracteres Unicode

Pesquise e explore caracteres Unicode por nome, ponto de código ou categoria. Encontre emoji, símbolos e caracteres especiais com suas entidades HTML e códigos de escape CSS.

Common Characters

Como Usar Busca de Caracteres Unicode

  1. 1Pesquise por nome do caractere (ex: "snowflake"), ponto de código (ex: U+2744) ou cole um caractere.
  2. 2Veja o nome do caractere, categoria, bloco e detalhes de codificação.
  3. 3Copie a entidade HTML, escape CSS ou código de escape JavaScript.
  4. 4Navegue pelos blocos e categorias Unicode.
ZenovayAnalytics

Analytics feito para fundadores.

  • Acompanhamento de visitantes em tempo real
  • Privacidade em primeiro lugar, sem banner de cookies
  • Configurado em dois minutos
Conheça o Zenovay

Perguntas Frequentes

O que é Unicode?
Unicode é um padrão de codificação de caracteres universal que atribui um número único (codepoint) a cada caractere em cada sistema de escrita. O Padrão Unicode cobre 149.813 caracteres (Unicode 15.1) em 161 scripts incluindo Latin, Árabe, Chinês, Japonês, Coreano, Devanagari, Emoji, símbolos matemáticos e scripts históricos. Codepoints Unicode são escritos como U+XXXX (por exemplo, U+0041 = A, U+1F600 = 😀). UTF-8, UTF-16 e UTF-32 são formas de codificação que armazenam codepoints Unicode como bytes.
Qual é a diferença entre Unicode e UTF-8?
Unicode é o padrão abstrato (atribui números a caracteres). UTF-8 é uma codificação concreta (converte esses números em bytes). Em UTF-8: caracteres ASCII (U+0000 para U+007F) usam 1 byte; caracteres até U+07FF usam 2 bytes; até U+FFFF usam 3 bytes; até U+10FFFF usam 4 bytes. UTF-8 é compatível com versões anteriores de ASCII e é a codificação dominante na web (~98% dos sites). UTF-16 usa 2 ou 4 bytes por caractere e é usado internamente por JavaScript e Java.
O que é um codepoint Unicode e como faço escape dele?
Um codepoint é o número único atribuído a cada caractere. U+0041 = decimal 65 = letra A. Formas de escape: entidade HTML: A ou A (hex) ou & (nomeada). JavaScript: \u0041 (BMP) ou \u{1F600} (faixa completa, ES2015+). CSS: \41 ou \000041. Python: \u0041 ou \U00001F600. JSON: \u0041 (apenas BMP, pares substitutos para outros). Codificação de URL: %41 (percent-encoded).
O que é um bloco Unicode?
Unicode é dividido em 308 blocos (Unicode 15.1), cada um um intervalo contíguo de codepoints para um grupo relacionado de caracteres. Exemplos: Basic Latin (U+0000-U+007F), Latin-1 Supplement (U+0080-U+00FF), Greek (U+0370-U+03FF), Cyrillic (U+0400-U+04FF), CJK Unified Ideographs (U+4E00-U+9FFF, 20.902 caracteres), Emoji (bloco Emoticons U+1F600-U+1F64F). O "Basic Multilingual Plane" (BMP) cobre U+0000 até U+FFFF.
O que são categorias Unicode?
Unicode atribui a cada caractere uma Categoria Geral: L (Letra): Lu=maiúscula, Ll=minúscula, Lt=titlecase, Lm=modificador, Lo=outro. N (Número): Nd=dígito decimal, Nl=número de letra, No=outro. P (Pontuação): Pc, Pd, Ps, Pe, Pi, Pf, Po. S (Símbolo): Sm=matemática, Sc=moeda, Sk=modificador, So=outro. Z (Separador): Zs=espaço, Zl=linha, Zp=parágrafo. C (Outro): Cc=controle, Cf=formato, Cs=substituto, Co=uso privado, Cn=não atribuído.