文字コード

デスクトップにインストールしたmovabletypeに読む記事を保存している。エントリーの内容に日本語のメモ、追記の箇所に英文をコピーしている。最初は英文のみが収録され、読み終わると、エントリーの内容に日本語のメモを入力するという形式だ。エントリーの内容が空白のものは未読としてリストに出力される。同時に追記部分に入力された英文も出力されるのだが、shift_jisで出力していたために文字化けが発生していた。大した量ではなかったので放置していたが、The EconomistはLatin-1にあってShift_jisには存在しないコード(クオーテーションの一種など)を多く利用しているので、文字化けがひどく読む気にもならなかった。そのためeuc_jpとして出力するようにして回避することに。すこしperlスクリプトを修正。

euc_jpにしても問題はありそうな気はするのだが、movabletype(euc_jpで設定)に入力する際に、自動的に類似の文字に置き換えているのかもしれない。