文字コードについてのまとめ


Unicode
すべての文字を16ビットで表し、1つの文字コードで多国語処理が可能。

■UTF8
Unicodeを8ビット単位で符号化する符号化方式。

EUC
主にUnixで用いられ、複数バイト文字を扱う。

■マルチバイト文字
1文字あたり1バイト以上の可変バイト列として表したもの。
Shift_JISはマルチバイト文字に含まれる。型はchar

■ワイド文字
全ての文字を等しいサイズのデータで表したもの。
Unicodeはワイド文字に含まれる。型はwchar_t

WindowsAPIのMultiByteToWideCharは、マルチバイトをワイド文字列(Unicode
に変換することができる。