| ページ一覧 | ブログ | twitter |  書式 | 書式(表) |

MyMemoWiki

Java ファイルの文字コードを判別する

提供: MyMemoWiki
2020年2月16日 (日) 04:27時点におけるPiroto (トーク | 投稿記録)による版
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

Java ファイルの文字コードを判別する

Java |

JISAutoDetect

juniversalchardet

public static String detectFileEncoding(File file) throws IOException  {
    String result = null;
    byte[] buf = new byte[4096];
    FileInputStream fis = new FileInputStream(file);
    UniversalDetector detector = new UniversalDetector(null);
    
    int nread;
    while ((nread = fis.read(buf)) > 0 && !detector.isDone()) {
        detector.handleData(buf, 0, nread);
    }
    detector.dataEnd();
    
    result =  detector.getDetectedCharset();
    detector.reset();
    
    return result;
}