Unicode・文字コードガイド
文字とコードポイントの関係、UTF-8・UTF-16による符号化、文字化けを避けるための考え方を基礎から学べます。初めての方は、以下の順番で読み進めてください。
初めての方におすすめの順番
文字の番号から、保存時のバイト列へ
Unicodeの基礎と変換
2記事
文字コード早見表
同じ文字でも表現の役割が異なります
| 文字 | コードポイント | UTF-8 | UTF-16 |
|---|---|---|---|
| A | U+0041 | 41 | 0041 |
| あ | U+3042 | E3 81 82 | 3042 |
| 漢 | U+6F22 | E6 BC A2 | 6F22 |
| 😀 | U+1F600 | F0 9F 98 80 | D83D DE00 |
手元の文字をすぐに変換する
Unicodeコード変換ツール文字列とU+形式を相互変換し、UTF-8・UTF-16・各種エスケープを確認できます。
UnicodeガイドのFAQ
Unicodeは何から学べばよいですか?
最初にUnicodeとコードポイントの関係を理解し、次にUTF-8・UTF-16がコードポイントをバイトやコード単位へ変換する方式だと学ぶと整理しやすくなります。
文字からUnicodeコードポイントを調べられますか?
はい。Unicodeコード変換ツールへ文字を入力すると、U+形式、10進数、UTF-8、UTF-16、エスケープ形式をまとめて確認できます。
UnicodeとUTF-8は同じものですか?
同じではありません。Unicodeは文字とコードポイントを定める規格で、UTF-8はそのコードポイントを1〜4バイトで表す符号化方式です。
このガイドは無料で読めますか?
はい。ガイド記事とUnicodeコード変換ツールは無料で利用でき、アカウント登録も不要です。