文字コード調査&変換方法 (nkf)

個人的にはnkfを使いこなせれば当面は十分な気がする。
もっと上級者はiconvとか使ったりする様子。

ファイル(hoge.txt)の文字コードの調べ方の覚書。

■nkf

nkf -g hoge.txt

■qkc
nkfエミュレートモードがあるらしい。

qkc -c hoge.txt

■kcc

kcc -c hoge.txt

ファイル変換方法についての覚書。お勧めはnkf。
上に書いた多くのコマンドで文字コード変更ができる。
また、改行コード変換機能も同時に使えるものが多い。

USAGE:  nkf(nkf32,wnkf,nkf2) -[flags] [in file] .. [out file for -O flag]
良く使うオプション
j,s,e,w  Outout code is JIS 7 bit (DEFAULT), Shift JIS, EUC-JP, UTF-8N
After 'w' you can add more options. -w[ 8 [0], 16 [[BL] [0]] ]
--in-place[=SUFFIX]  --overwrite[=SUFFIX]
Overwrite original listed files by filtered result
--overwrite preserves timestamp of original files
-g  --guess       Guess the input code

■ファイルをutf8に上書き置換

    • in-placeだとどうも上手く変換されていない感がある。

コレが原因かは不明だけどファイルの先頭に?が入ったりする。

    • in-placeのせいかは微妙だが、–overwrite使うのが無難かも。
nkf -w8 --overwrite hoge.txt

■別ファイルにするにはリダイレクト

nkf -w8 hoge.txt > hoge_utf8.txt

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です