python

文字コードの自動認識

urllib2で取得したhtmlの文字コードを自動認識する方法 def guess_charset(data): f = lambda d, enc: d.decode(enc) and enc try: return f(data, 'utf-8') except: pass try: return f(data, 'shift-jis') except: pass try: return f(data, 'euc-jp') exc…