As I Please

MTのいんすとーるの練習と、その他びぼうろく・・・

unicode_escape

最近、python使うことがちょこちょこ。 内部の文字コードがutfになってて、ログとか外部出力する際に、明示的に指定していないとデフォルトでは、unicode_escape されてることが多いようだ。って、

薫製 -> u'\u85ab\u88fd'

これを、例えばEUCに戻すコード。

import string,sys,os
import re
while 1:
line = sys.stdin.readline()
if not line: break
try:
query_euc = unicode(line,encoding="unicode_escape").encode("euc_jp")
except UnicodeError:
pass;
except IndexError:
pass
print query_euc

see http://www.python.jp/doc/current/lib/node127.html

コメントする