Unicode文字検索

名前、コードポイント、またはカテゴリーでUnicode文字を検索および探索します。絵文字、シンボル、特殊文字をそれらのHTML実体およびCSSエスケープコードと共に見つけます。

Common Characters

Unicode文字検索の使い方

  1. 1文字名(例:"snowflake")、コードポイント(例:U+2744)で検索するか、文字を貼り付けます。
  2. 2文字の名前、カテゴリー、ブロック、エンコーディング詳細を表示します。
  3. 3HTML実体、CSSエスケープ、またはJavaScriptエスケープコードをコピーします。
  4. 4Unicodeブロックおよびカテゴリーを参照します。
Zenovayアナリティクス

創業者のためのアナリティクス。

  • リアルタイムの訪問者トラッキング
  • プライバシーファースト、クッキーバナーなし
  • 2分でセットアップ
Zenovayを見る

よくある質問

Unicodeとは何ですか?
Unicodeは、あらゆる文字体系のあらゆる文字に一意の番号(コードポイント)を割り当てる、普遍的な文字エンコーディング標準です。Unicode標準は、ラテン文字、アラビア文字、中国語、日本語、韓国語、デーヴァナーガリー、絵文字、数学記号、歴史的スクリプトなど、161の文字体系にまたがる149,813文字(Unicode 15.1)をカバーしています。Unicodeコードポイントはu+XXXX(例:U+0041 = A、U+1F600 = 😀)で記述されます。UTF-8、UTF-16、UTF-32はUnicodeコードポイントをバイトとして保存するエンコーディング形式です。
UnicodeとUTF-8の違いは何ですか?
Unicodeは抽象的な標準です(文字に番号を割り当てます)。UTF-8は具体的なエンコーディングです(それらの番号をバイトに変換します)。UTF-8では:ASCII文字(U+0000からU+007F)は1バイトを使用します。U+07FFまでの文字は2バイト、U+FFFFまで3バイト、U+10FFFFまで4バイトを使用します。UTF-8はASCIIと下位互換性があり、Web上で支配的なエンコーディングです(~98%のWebサイト)。UTF-16は文字あたり2または4バイトを使用し、JavaScriptとJavaで内部的に使用されます。
Unicodeコードポイントとは何ですか、そしてそれをエスケープするにはどうすればよいですか?
コードポイントは、各文字に割り当てられた一意の番号です。U+0041 = 10進数65 = 文字A。エスケープ形式:HTMLエンティティ:AまたはA(16進数)または&(名前付き)。JavaScript:\u0041(BMP)または\u{1F600}(フルレンジ、ES2015+)。CSS:\41または\000041。Python:\u0041または\U00001F600。JSON:\u0041(BMP のみ、他の場合はサロゲートペア)。URLエンコーディング:%41(パーセントエンコード)。
Unicodeブロックとは何ですか?
Unicodeは308ブロック(Unicode 15.1)に分割され、それぞれは関連する文字のグループのコードポイントの連続範囲です。例:Basic Latin(U+0000-U+007F)、Latin-1 Supplement(U+0080-U+00FF)、Greek(U+0370-U+03FF)、Cyrillic(U+0400-U+04FF)、CJK Unified Ideographs(U+4E00-U+9FFF、20,902文字)、Emoji(Emoticonsブロック U+1F600-U+1F64F)。"Basic Multilingual Plane"(BMP)はU+0000からU+FFFFまでをカバーします。
Unicode カテゴリーとは何ですか?
Unicodeは各文字に一般カテゴリを割り当てます:L(文字):Lu=大文字、Ll=小文字、Lt=タイトルケース、Lm=修飾子、Lo=その他。N(数字):Nd=10進数字、Nl=文字番号、No=その他。P(句読点):Pc、Pd、Ps、Pe、Pi、Pf、Po。S(記号):Sm=数学、Sc=通貨、Sk=修飾子、So=その他。Z(区切り文字):Zs=スペース、Zl=行、Zp=段落。C(その他):Cc=制御、Cf=形式、Cs=サロゲート、Co=プライベート使用、Cn=未割り当て。