string utf8_encode
(string data);この関数は、文字列 data を UTF-8 にエンコードし、エンコードされた文字列を 返します。 UTF-8 は、 wide character の値をバイトストリームに エンコードするために Unicode で使用される 標準的な仕組みです。 UTF-8 は、プレーンな ASCII 文字を通し、自己同期 (これは、バイトストリームの開始地点をプログラムが見積もることが可能で あることを意味します) します。 また、ソートのような標準的な文字列比較関数を使用可能です。 PHP は、UTF-8 文字を次のように 最大 4 バイトでエンコードします。
表 1. UTF-8 エンコード法
バイト | ビット | 表現形式 |
---|---|---|
1 | 7 | 0bbbbbbb |
2 | 11 | 110bbbbb 10bbbbbb |
3 | 16 | 1110bbbb 10bbbbbb 10bbbbbb |
4 | 21 | 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb |