今さらですけど、自分でもちゃんと把握してなかったので調べてみました。
MySQLのCharsetのうちシフトJIS系のものはsjisとcp932の二つあります。
どちらもコードの範囲は次のように同じです。
1バイト文字 | 0x00-0x7F, 0xA1-0xDF |
2バイト文字の1バイト目 | 0x81-0x9F, 0xE0-0xFC |
2バイト文字の2バイト目 | 0x40-0x7E, 0x80-0xFC |
違いは文字集合です。1バイト文字はどちらも同じ(ASCII + JIS X 0201 カナ)ですが、2バイト文字はsjisはJIS X 0208 で、cp932はWindows-31Jです。
sjisに含まれていない文字
…
[さらに読む]