〜と〜
- 〜はEUC-JPでWAVE-DASH(0x301C)である
- 〜はShift-JISでFULLWIDTH-TILDE(0xFF5E)である
- UNICODEは上記のどちらも持っている
- そのため、EUC-JP→UNICODEもしくはShift-JIS→UNICODEに変換する際、その変換はベンダ依存となってしまっている
- 具体的には、HTMLページからPOSTされてきたWAVE-DASHが、JAVA内部でFULLWIDTH-THILDEとして保持されたりする
- そのままEUC-JPのデータベースに格納しようとした場合、EUCに無いコードのため、文字化けが発生する(JDBCによっては変換してくれるものもあるかも)
- そのため、データベースがEUC-JPの場合、内部で0xFF5Eを0x301Cに変換してやる必要がある
今はこんな認識。
間違ってるかもしれないのでもうちょい調査。
うぉ、両方〜に変換されてる。