Unicode文字検索

名前、コードポイント、またはカテゴリーでUnicode文字を検索および探索します。絵文字、シンボル、特殊文字をそれらのHTML実体およびCSSエスケープコードと共に見つけます。

Search by name, codepoint (U+2764), or paste a character

Common Characters

Unicode文字検索の使い方

1文字名（例："snowflake"）、コードポイント（例：U+2744）で検索するか、文字を貼り付けます。
2文字の名前、カテゴリー、ブロック、エンコーディング詳細を表示します。
3HTML実体、CSSエスケープ、またはJavaScriptエスケープコードをコピーします。
4Unicodeブロックおよびカテゴリーを参照します。

Zenovayアナリティクス

創業者のためのアナリティクス。

リアルタイムの訪問者トラッキング
プライバシーファースト、クッキーバナーなし
2分でセットアップ

Zenovayを見る

よくある質問

Unicodeとは何ですか？▾

Unicodeは、あらゆる文字体系のあらゆる文字に一意の番号（コードポイント）を割り当てる、普遍的な文字エンコーディング標準です。Unicode標準は、ラテン文字、アラビア文字、中国語、日本語、韓国語、デーヴァナーガリー、絵文字、数学記号、歴史的スクリプトなど、161の文字体系にまたがる149,813文字（Unicode 15.1）をカバーしています。Unicodeコードポイントはu+XXXX（例：U+0041 = A、U+1F600 = 😀）で記述されます。UTF-8、UTF-16、UTF-32はUnicodeコードポイントをバイトとして保存するエンコーディング形式です。

UnicodeとUTF-8の違いは何ですか？▾

Unicodeは抽象的な標準です（文字に番号を割り当てます）。UTF-8は具体的なエンコーディングです（それらの番号をバイトに変換します）。UTF-8では：ASCII文字（U+0000からU+007F）は1バイトを使用します。U+07FFまでの文字は2バイト、U+FFFFまで3バイト、U+10FFFFまで4バイトを使用します。UTF-8はASCIIと下位互換性があり、Web上で支配的なエンコーディングです（~98%のWebサイト）。UTF-16は文字あたり2または4バイトを使用し、JavaScriptとJavaで内部的に使用されます。

Unicodeコードポイントとは何ですか、そしてそれをエスケープするにはどうすればよいですか？▾

コードポイントは、各文字に割り当てられた一意の番号です。U+0041 = 10進数65 = 文字A。エスケープ形式：HTMLエンティティ：AまたはA（16進数）または&（名前付き）。JavaScript：\u0041（BMP）または\u{1F600}（フルレンジ、ES2015+）。CSS：\41または\000041。Python：\u0041または\U00001F600。JSON：\u0041（BMP のみ、他の場合はサロゲートペア）。URLエンコーディング：%41（パーセントエンコード）。

Unicodeブロックとは何ですか？▾

Unicodeは308ブロック（Unicode 15.1）に分割され、それぞれは関連する文字のグループのコードポイントの連続範囲です。例：Basic Latin（U+0000-U+007F）、Latin-1 Supplement（U+0080-U+00FF）、Greek（U+0370-U+03FF）、Cyrillic（U+0400-U+04FF）、CJK Unified Ideographs（U+4E00-U+9FFF、20,902文字）、Emoji（Emoticonsブロック U+1F600-U+1F64F）。"Basic Multilingual Plane"（BMP）はU+0000からU+FFFFまでをカバーします。

Unicode カテゴリーとは何ですか？▾

Unicodeは各文字に一般カテゴリを割り当てます：L（文字）：Lu=大文字、Ll=小文字、Lt=タイトルケース、Lm=修飾子、Lo=その他。N（数字）：Nd=10進数字、Nl=文字番号、No=その他。P（句読点）：Pc、Pd、Ps、Pe、Pi、Pf、Po。S（記号）：Sm=数学、Sc=通貨、Sk=修飾子、So=その他。Z（区切り文字）：Zs=スペース、Zl=行、Zp=段落。C（その他）：Cc=制御、Cf=形式、Cs=サロゲート、Co=プライベート使用、Cn=未割り当て。

画像ツール