日本語の表示とコンテンツタイプ

日本語をブラウザ上に出力するにはresponseに対して
コンテンツタイプを設定する必要がある。

response.setContentType("text/html ; charset=Windows-31J");

文字列の前半はMIME。後半は文字セット。またこのsetSontentType()はPrintWriterオブジェクトをResponseから取得する前に設定する必要がある。

  • MIME
MIMEタイプはデータのやり取りの種類を決める。
ファイル形式 一般的な拡張子 MIMEタイプ
テキスト .txt text/plain
html文章 .html text/html
xml文章 .xml text/xml
cssファイル .css text/css
JPEG画像 .jpg image/jpeg
GIF画像 .gif image/gif
Wordファイル .doc application/msword
Excelファイル .xls application/vnd.ms-excel
PDF文章 .pdf application/pdf
などが用意されているが、text/htmlかtext/plainを用いることがほとんどである。

  • 文字エンコーディング
文字を符号化・複合化する決まりのこと。主な文字エンコーディングには次のようなものがある。

文字エンコーディング 説明
ISO-8859-1 欧米で利用されている文字コード
Shift_JIS 日本語Windows環境で利用されている文字コード
EUC-JP 日本語UNIX環境で標準で利用されている文字コード
UTF-8 ユニコードを基にした文字コードの一つ。国際標準として推奨される
Windows-31J Microsoft社のShift_JISの拡張
ISO-2022-JP メールなどでよく利用されている日本語文字コード

この中から適切なものを選ぶ。サーブレットではデフォルトでISO-8859-1に設定されているため、日本語を利用するときには適切なものに設定し直す。

タグ:

サーブレット
最終更新:2007年01月21日 12:18