Unicode・文字コードガイド

文字とコードポイントの関係、UTF-8・UTF-16による符号化、文字化けを避けるための考え方を基礎から学べます。初めての方は、以下の順番で読み進めてください。

初めての方におすすめの順番

文字の番号から、保存時のバイト列へ

Unicodeの基礎と変換

2記事

文字コード早見表

同じ文字でも表現の役割が異なります

文字コードポイントUTF-8UTF-16
AU+0041410041
U+3042E3 81 823042
U+6F22E6 BC A26F22
😀U+1F600F0 9F 98 80D83D DE00
手元の文字をすぐに変換する

文字列とU+形式を相互変換し、UTF-8・UTF-16・各種エスケープを確認できます。

Unicodeコード変換ツール

UnicodeガイドのFAQ

Unicodeは何から学べばよいですか?
最初にUnicodeとコードポイントの関係を理解し、次にUTF-8・UTF-16がコードポイントをバイトやコード単位へ変換する方式だと学ぶと整理しやすくなります。
文字からUnicodeコードポイントを調べられますか?
はい。Unicodeコード変換ツールへ文字を入力すると、U+形式、10進数、UTF-8、UTF-16、エスケープ形式をまとめて確認できます。
UnicodeとUTF-8は同じものですか?
同じではありません。Unicodeは文字とコードポイントを定める規格で、UTF-8はそのコードポイントを1〜4バイトで表す符号化方式です。
このガイドは無料で読めますか?
はい。ガイド記事とUnicodeコード変換ツールは無料で利用でき、アカウント登録も不要です。