文字化けの対処
Webアプリケーションでの文字化けの対処
Java
HttpServletRequest クラス
public void setCharacterEncoding(java.lang.String env) throws java.io.UnsupportedEncodingException
この要求の本体で使用される文字エンコーディングの名前をオーバーライドします。 このメソッドは、要求パラメータの読み取り、 または getReader() を使用した入力の読み取りに先立って呼び出す必要があります。
URLEncoder|http://java.sun.com/javase/ja/6/docs/ja/api/java/net/URLEncoder.html、 [URLDecoder] クラス
HTML 形式をエンコード、デコードするためのユーティリティクラス。 String と application/x-www-form-urlencoded MIME 形式 をエンコード、デコードするための static メソッドを含む。
- 「a」から「z」、「A」から「Z」、「0」から「9」、「-」、「_」、「.」、「*」。文字 「%」は使用可能だが、特殊なエスケープシーケンスの開始と解釈
- 英数字文字の「a」から「z」、「A」から「Z」、および「0」から「9」は元のまま残す
- 特殊文字の「.」、「-」、「*」、および「_」は元のまま残す
- プラス記号「+」を空白文字「 」に変換する
- 「%xy」という形式のシーケンスは、バイトの表現として扱う
JavaScript の encodeURIComponent、decodeURIComponent に対応
JSP
<%@ page contentType="text/html; charset=Shift-JIS" %>
出力の文字エンコーディングをpage指示子を用いて設定します。
<%@ page pageEncoding="Shift-JIS" %>
取り込むファイルの文字エンコーディングを指定
WebサーバやWebブラウザでは,charsetは次のような優先順位で処理するように HTML仕様 4.0で規定されています.
- Content-Typeのcharsetパラメータ (HTTP)
- http-equivのあるMETA宣言のContent-Typeやcharsetの値 (HTML)
- 要素のcharset属性 (HTML)
ServletやJSPのContent-Typeで"text/html; charset=Shift_JIS"のように charsetを指定した場合は(1)に相当します
ECMAScript(JavaScript)
encodeURI, decodeURI, encodeURIComponent, decodeURIComponent
escape/unescape と違って RFC 準拠 (RFC 2396 Uniform Resource Identifiers (URI): Generic Syntax) JavaScript では ECMA-262 3rd Edition に対応するバージョン 1.5 で、これらの関数に対応 JScript はバージョン 5.5 で対応(MSIE 5.5)
encodeURIでは、"&"や"+"や"="などの文字をエンコードしないので、GETやPOSTメソッドで利用するときは、encodeURIComponentを使用する。こちらは、英数以外は、"- _ . ! ~ * ' ( ) "のみがエスケープされない。
HTML特殊文字の処理
[HTML javascript:を利用するとデコードされる] [javascript:を利用するとデコードされる]
参照
http://www.w3.org/TR/html40/appendix/notes.html#non-ascii-chars http://www.cresc.co.jp/tech/java/URLencoding/JavaScript_URLEncoding.htm
© 2006 矢木浩人