肖 英
1.武漢軟件工程職業(yè)學院,湖北武漢 430205 2.武漢市廣播電視大學,湖北武漢 430033
解決JSP/Servlet開發(fā)中的中文亂碼問題
肖 英1,2
1.武漢軟件工程職業(yè)學院,湖北武漢 430205 2.武漢市廣播電視大學,湖北武漢 430033
基于JSP/Servlet技術(shù)的Java Web應用開發(fā)中,中文亂碼是個惱人的問題,給開發(fā)者帶來不小的麻煩,本文就著重討論了JSP/Servlet開發(fā)中幾種典型的中文亂碼問題,并給出了相應的解決方案。
JSP/Servlet;中文亂碼
基于JSP/Servlet技術(shù)的Java Web應用開發(fā)中,中文亂碼是個如影隨形的問題,總是揮之不去,對于Java Web應用開發(fā)的初學者造成不少的困擾。Java Web應用是由多種Web組件協(xié)同合作的,同時還需要瀏覽器和數(shù)據(jù)庫的支持,中文亂碼問題產(chǎn)生的根源就在于這些Web組件之間、或web組件與瀏覽器、與數(shù)據(jù)庫所使用的字符集標準不統(tǒng)一。因此,要解決中文亂碼,其基本原則就是:保持數(shù)據(jù)傳輸?shù)钠瘘c、終點、傳輸通道上的編碼一致。
下面分幾種常見的情形給出中文亂碼的解決方案,這些解決方案統(tǒng)一使用UTF-8作為編碼字符集。
1.1 瀏覽器顯示中文時的亂碼
瀏覽器在顯示JSP頁面時,若頁面含中文內(nèi)容,可能會出現(xiàn)中文亂碼,其原因是:JSP頁面與瀏覽器的字符集不匹配。
解決方案:讓JSP頁面與瀏覽器使用統(tǒng)一的編碼字符集??稍贘SP中使用如下代碼實現(xiàn):<%@page pageEncoding="utf-8"
contentType="text/html;charset=utf-8"%>
其中,pageEncoding="utf-8"代表JSP使用utf-8字符集,contentType="text/html;charset=utf-8"代表瀏覽器使用utf-8字符集解釋收到的數(shù)據(jù)。
若是從Servlet向瀏覽器輸出內(nèi)容,可在Servlet中使用如下代碼使瀏覽器采用utf-8編碼進行顯示:
response.setContentType("text/html;charset=utf-8");
PrintWriter out = response.getWriter();
out.println("中文!");
1.2 獲取表單中文參數(shù)時的亂碼
對于<form>表單,在JSP/Servlet中可采用request.getParameter(“參數(shù)名”)來獲取參數(shù)值,但若不做適當處理,表單參數(shù)值為中文時就會發(fā)生亂碼問題。這是因為,<form>表單參數(shù)使用post方式提交時,是通過request對象傳輸?shù)?,且Tomcat對其的編碼方式是iso-8859-1,當表單頁和獲取表單的組件不是采用與之相同的字符集時就會出現(xiàn)亂碼了。
解決方案:讓表單頁、封裝表單數(shù)據(jù)的request對象和接收表單數(shù)據(jù)的組件采用統(tǒng)一的編碼字符集。假定表單頁為index.jsp,接收表單頁為receive.jsp,則具體如下:
若接收表單的是Servlet,則在Servlet中,取表單參數(shù)值之前先使用request.setCharacterEncoding("utf-8") 進行轉(zhuǎn)碼即可。
1.3 進行數(shù)據(jù)庫操作時的亂碼
這里數(shù)據(jù)庫以MySQL為例進行討論。當JSP/Servlet要與數(shù)據(jù)庫進行交互時,若JSP/Servlet、傳輸通道、數(shù)據(jù)庫三者采用的編碼字符集不一致也會導致亂碼問題的出現(xiàn)。傳輸通道是指:JSP/ Servlet連接數(shù)據(jù)庫的連接對象。
解決方案:
第一步:確定JSP/Servlet采用utf-8編碼,要寫至數(shù)據(jù)庫的中文數(shù)據(jù)正常,若數(shù)據(jù)來自表單,則參考1.2正確取到中文參數(shù)值。
第二步:確定數(shù)據(jù)庫采用utf-8編碼。對于MySQL而言,可以使用其配置向?qū)гO置數(shù)據(jù)庫采用utf-8作為默認字符集;創(chuàng)建表時,對于允許中文的字段,設字段的字符集為utf-8。
第三步:連接MySQL數(shù)據(jù)庫的連接對象上設置字符集為utf-8。假設數(shù)據(jù)庫名為db1,則獲取連接的數(shù)據(jù)庫URL如下:jdbc:mysql://localhost:3306/db1?user=root&password=123456
&useUnicode=true&characterEncoding=utf8
其中,useUnicode=true&characterEncoding=utf8為關鍵代碼,表示連接對象(即數(shù)據(jù)的傳輸通道)采用utf-8編碼字符集。
JSP/Servlet開發(fā)Java Web應用時的中文亂碼問題雖然惱人,但只要把握住解決問題的基本原則:保持數(shù)據(jù)傳輸?shù)钠瘘c、終點、傳輸通道上的編碼一致,在出現(xiàn)中文亂碼后仔細檢查各處的編碼字符集是否一致并即時予以糾正,相信初學者也能很好地解決中文亂碼問題了。
[1]孫衛(wèi)琴.Tomcat與Java Web開發(fā)技術(shù)詳解[M].電子工業(yè)出版社,2005,8.
[2]王國輝,等.JSP數(shù)據(jù)庫系統(tǒng)開發(fā)完全手冊[M].人民郵電出版社,2006,3.
TP39
A
1674-6708(2011)34-0193-01
肖英,講師,工作單位:武漢軟件工程職業(yè)學院軟件技術(shù)系,研究方向:軟件開發(fā)