〜と〜

  • 〜はEUC-JPでWAVE-DASH(0x301C)である
  • 〜はShift-JISでFULLWIDTH-TILDE(0xFF5E)である
  • UNICODEは上記のどちらも持っている
  • そのため、EUC-JP→UNICODEもしくはShift-JIS→UNICODEに変換する際、その変換はベンダ依存となってしまっている
  • 具体的には、HTMLページからPOSTされてきたWAVE-DASHが、JAVA内部でFULLWIDTH-THILDEとして保持されたりする
  • そのままEUC-JPのデータベースに格納しようとした場合、EUCに無いコードのため、文字化けが発生する(JDBCによっては変換してくれるものもあるかも)
  • そのため、データベースがEUC-JPの場合、内部で0xFF5Eを0x301Cに変換してやる必要がある

今はこんな認識。
間違ってるかもしれないのでもうちょい調査。

うぉ、両方〜に変換されてる。