某商用サイトでアニメ「Fate/Grand Order -絶対魔獣戦線バビロニア-」のあらすじを読んでいて”アレ?”と首を傾げてしまった。
そこには”ティアマト”のことを”ビースト(監)”と書いてあった。
私はすぐに「ははぁ、”ビーストII”と書いたのが文字化けしたな」と判ったんだけど、ゲームやアニメ本編を見ていない人なら”???”となることだろう。
ローマ数字の”II”はShift_JIS”には含まれておらず、MS-DOS/WindowsとMacOSでは異なるコードを割り当てていて、MS-DOS/Windowsで”II”と表記したのをMacOSで読むと”(監)”と読めてしまうのだ。
今回のはWindows10の環境で(監)と見えていて、件のサイトのページのソースを見ると文字コードはUTF-8となっていたので、Windows環境でShift_JISで”II”と入力したのをMacOS環境でhtml化する際に文字化けしたまま文字コードをUTF-8に変換したのでは無いだろうか?
このページには複数の(監)の文字が散見されるので、もしかすると変換は一括で行っていてチェックもしていないのかな?
More from: 文字コード
今度は文字化けかよ・・・
昨日カンマ区切りのテキストファイルを送った相手(の上司)から今度は文字化けして読めないとの連絡が来た。
送ってきたファイルをエクセルで開くと確かに文字化けしている。
テキストエディターで開くと問題無く読めるが、文字コードがUTF-8だった。
エクセルはBOMが無いファイルは無条件でSJISとして開くらしいので、そのために文字化けして見えるようだ。
文字コードくらいは自分で変換して貰いたいものだが、その方法を伝えるよりも自分で変換して送り直す方が早いのでそうした。
エクセルでもUTF-8のcsvファイルを取り込むことは可能だけど操作が面倒なので、事前に変換してしまう方がダブルクリック一発で開けるので楽なことは間違いない。
「Excelで開くと文字化けするUTF-8のCSVを文字コードを変換せずに開く方法」
にはこの辺の変換方法やエクセルでのUTF-8のファイルの取り込み方法が出ているのでよければ参考に。
スクリプトは動くようになった
先日から作っていたファイルフォーマット及び文字コード変換用のスクリプトがようやく形になった(汗)。
元のファイルの中に複数の形式のレコードが混在していたので面倒だったけど、そこはなんとか力技で押さえ込んだ。
てこずったのが特定の文字(全角の長音記号)が元のコード(SJIS)から他のコード(EUC,UTF-8)に変換できなかったこと。
いろいろ調べてみたけど皆さん苦労していらっしゃるようで上手い解決策が見つからなかった。
仕方が無いのでテキストエディターで開いて全角のハイフンに一括変換をかけることで対処した。
元のファイルが三十数個程度だったのでこんな荒業が使えたけど、これがファイル数が三桁だったらやりたくないよなぁ・・・
どうにかして自動で変換できないものか・・・
WindowsエクスプローラーでFTPサーバに接続した時の日本語ファイル名が化ける件
昨日書いた記事「Windowsからftpサーバへの接続メモ」の続きだけど、WindowsエクスプローラーでFTPサーバへの接続は可能になったけど、日本語のファイル/ディレクトリ名が文字化けしてしまって読めない件はFTPサーバーをvsftpdからProFTPdに切り替えることで解決できそうな気配。
早速現時点での最新ソース「proftpd-1.3.4rc3.tar.gz」を落としてきてコンパイルしてインストールしたが、デフォルトでは文字コード変換のモジュールが無いのでproftpd.confに文字コードの設定を書いてもエラーになってしまい(←当たり前)文字化けは直らない。
で、その文字コード変換のモジュールを探しているのだが、1.3.0用のパッチ(proftpd-1.3.0-iconv.patch.gz)が置いてあるサイトに接続できずダウンロードが出来ない。
うーん、どっかにミラーされていないのかなぁ?