- 浏览: 1465977 次
- 性别:
- 来自: 深圳
文章分类
- 全部博客 (798)
- struts2 (42)
- servlet (20)
- quartz (4)
- jquery & ajax (24)
- tomcat (5)
- javascript (15)
- struts1 (8)
- 搜索关键字及链接 (3)
- fckeditor (3)
- Apache (5)
- spring (22)
- linux (3)
- 企业应用 (8)
- 综合应用 (13)
- 服务器 (2)
- 数据库 (85)
- 性能调优 (21)
- 网络应用 (15)
- 缓存技术 (8)
- 设计模式 (39)
- 面试题 (7)
- 程序人生&前辈程序员 (29)
- java基础 (59)
- hibernate (75)
- log4j (4)
- http (11)
- 架构设计 (28)
- 网页设计 (12)
- java邮件 (4)
- 相关工具 (11)
- ognl (7)
- 工作笔记 (18)
- 知识面扩展 (12)
- oracle异常 (1)
- 正则表达式 (2)
- java异常 (5)
- 项目实践&管理 (1)
- 专业术语 (11)
- 网站参考 (1)
- 论坛话题 (2)
- web应用 (11)
- cxf&webservice (22)
- freemarker (3)
- 开源项目 (9)
- eos (1)
- ibatis (6)
- 自定义标签 (3)
- jsp (3)
- 内部非公开文档(注意:保存为草稿) (0)
- 国内外知名企业 (2)
- 网店 (3)
- 分页 (1)
- 消费者习惯 (2)
- 每日关注 (1)
- 商业信息 (18)
- 关注商业网站 (1)
- 生活常识 (3)
- 新闻 (2)
- xml&JSON (5)
- solaris (1)
- apache.common (3)
- BLOB/CLOB (1)
- lucene (2)
- JMS (14)
- 社会进程 (8)
- SSH扩展 (2)
- 消费心理 (1)
- 珠三角 (1)
- 设计文档 (1)
- XWork&webwork (1)
- 软件工程 (3)
- 数据库及链接 (1)
- RMI (2)
- 国内外知名企业&人物 (1)
最新评论
-
司c马:
简介易懂、
OutputStream和InputStream的区别 -
在世界的中心呼喚愛:
解决我的问题
Java获取客户端的真实IP地址 -
bo_hai:
都是些基本的概念呀!
SSO -
tian_4238:
哥们,你也是搞水利这块的吧。
巧用SQLQuery中的addScalar -
loveEVERYday:
java.util.Date、java.sql.Date、java.sql.Time、java.sql.Timestamp小结
Java中文问题一直困扰着很多初学者,如果了解了Java系统的中文问题原理,我们就可以对中文问题能够采取根本的解决之道。
最古老的解决方案是使用String的字节码转换,这种方案问题是不方便,我们需要破坏对象封装性,进行字节码转换。
还有一种方式是对J2EE容器进行编码设置,如果J2EE应用系统脱离该容器,则会发生乱码,而且指定容器配置不符合J2EE应用和容器分离的原则。
在Java内部运算中,涉及到的所有字符串都会被转化为UTF-8编码来进行运算。那么,在被Java转化之前,字符串是什么样的字符集? Java总是根据操作系统的默认编码字符集来决定字符串的初始编码,而且Java系统的输入和输出的都是采取操作系统的默认编码。
因此,如果能统一Java系统的输入、输出和操作系统3者的编码字符集合,将能够使Java系统正确处理和显示汉字。这是处理Java系统汉字的一个原则,但是在实际项目中,能够正确抓住和控制住Java系统的输入和输出部分是比较难的。J2EE中,由于涉及到外部浏览器和数据库等,所以中文问题乱码显得非常突出。
J2EE应用程序是运行在J2EE容器中。在这个系统中,输入途径有很多种:一种是通过页面表单打包成请求(request)发往服务器的;第二种是通过数据库读入;还有第3种输入比较复杂,JSP在第一次运行时总是被编译成Servlet,JSP中常常包含中文字符,那么编译使用javac时,Java将根据默认的操作系统编码作为初始编码。除非特别指定,如在Jbuilder/eclipse中可以指定默认的字符集。
输出途径也有几种:第一种是JSP页面的输出。由于JSP页面已经被编译成Servlet,那么在输出时,也将根据操作系统的默认编码来选择输出编码,除非指定输出编码方式;还有输出途径是数据库,将字符串输出到数据库。
由此看来,一个J2EE系统的输入输出是非常复杂,而且是动态变化的,而Java是跨平台运行的,在实际编译和运行中,都可能涉及到不同的操作系统,如果任由Java自由根据操作系统来决定输入输出的编码字符集,这将不可控制地出现乱码。
正是由于Java的跨平台特性,使得字符集问题必须由具体系统来统一解决,所以在一个Java应用系统中,解决中文乱码的根本办法是明确指定整个应用系统统一字符集。
指定统一字符集时,到底是指定ISO8859_1 、GBK还是UTF-8呢?
(1)如统一指定为ISO8859_1,因为目前大多数软件都是西方人编制的,他们默认的字符集就是ISO8859_1,包括操作系统Linux和数据库MySQL等。这样,如果指定Jive统一编码为ISO8859_1,那么就有下面3个环节必须把握:
开发和编译代码时指定字符集为ISO8859_1。
运行操作系统的默认编码必须是ISO8859_1,如Linux。
在JSP头部声明:<%@ page contentType="text/html;charset=ISO8859_1" %>。
(2)如果统一指定为GBK中文字符集,上述3个环节同样需要做到,不同的是只能运行在默认编码为GBK的操作系统,如中文Windows。
统一编码为ISO8859_1和GBK虽然带来编制代码的方便,但是各自只能在相应的操作系统上运行。但是也破坏了Java跨平台运行的优越性,只在一定范围内行得通。例如,为了使得GBK编码在linux上运行,设置Linux编码为GBK。
那么有没有一种除了应用系统以外不需要进行任何附加设置的中文编码根本解决方案呢?
将Java/J2EE系统的统一编码定义为UTF-8。UTF-8编码是一种兼容所有语言的编码方式,惟一比较麻烦的就是要找到应用系统的所有出入口,然后使用UTF-8去“结扎”它。
一个J2EE应用系统需要做下列几步工作:
开发和编译代码时指定字符集为UTF-8。JBuilder和Eclipse都可以在项目属性中设置。
使用过滤器,如果所有请求都经过一个Servlet控制分配器,那么使用Servlet的filter执行语句,将所有来自浏览器的请求(request)转换为UTF-8,因为浏览器发过来的请求包根据浏览器所在的操作系统编码,可能是各种形式编码。关键一句:
request.setCharacterEncoding("UTF-8")
网上有此filter的源码。
在JSP头部声明:
<%@ page contentType="text/html;charset= UTF-8" %>
在Jsp的html代码中,声明UTF-8:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
设定数据库连接方式是UTF-8。例如连接MYSQL时配置URL如下:
jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=UTF-8
一般数据库都可以通过管理设置设定UTF-8。
其他和外界交互时能够设定编码时就设定UTF-8,例如读取文件,操作XML等。
笔者以前在Jsp/Servlet时就采取这个原则,后来使用Struts、Tapestry、EJB、Hibernate、Jdon等框架时,从未被乱码困扰过,可以说适合各种架构。希望本方案供更多初学者分享,减少Java/J2EE的第一个拦路虎,也避免因为采取一些临时解决方案,导致中文问题一直出现在新的技术架构中。
发表评论
-
UTF-8 GBK UTF8 GB2312
2011-08-19 10:46 1876UTF-8:Unicode TransformationFor ... -
Properties 类读取配置文件
2011-08-17 22:37 14321、使用java.util.Properties类的load( ... -
Java编程之四大名著
2011-08-06 10:07 1410中文第四版 http://download.csdn.n ... -
JDK5.0 新特性
2011-07-28 20:02 13241.AutoBoxing 原来int是非 ... -
JDK6的新特性
2011-07-28 19:57 1735JDK6的新特性 JDK6的新特性之一_Desktop类和Sy ... -
线程同步
2011-07-25 11:34 1228作者 : buaawhl http://www.iteye.c ... -
ZipInputStream类
2011-07-22 11:33 18704《Java开发实战经典》第12章Java IO,Java ... -
String、StringBuffer和StringBuilder的区别
2011-07-14 15:04 1314String是不可变的,StringBuffer是可变的;St ... -
精通JAVA核心技术
2011-07-11 11:31 1228http://www.2cto.com/ebook/20100 ... -
Java多线程sleep(),join(),interrupt(),wait(),notify()
2011-07-06 22:51 4849浅析 Java Thread.join() 一、在研究j ... -
FileInputStream/FileOutputStream的应用
2011-07-06 15:06 1368这是一对继承于InputStream和OutputStream ... -
Java基础之理解JNI原理
2011-07-05 14:55 1268JNI是JAVA标准平台中的一个重要功能,它弥补了JAVA ... -
面向对象和面向过程的区别
2011-07-04 09:52 1367面向过程就是分析出解 ... -
Java参数传值还是传引用
2011-07-03 20:52 3582参数是按值而不是按 ... -
JAVA排序汇总
2011-06-29 18:07 1411package com.softeem.jbs.lesson4 ... -
Java流操作,InputStream、OutputStream及子类FileInputStream、FileOutputStream;BufferedInpu
2011-06-27 18:09 19188Java将数据于目的地及来 ... -
线程综合文章
2011-06-27 10:48 1076http://lavasoft.blog.51cto.com/ ... -
由Java中的Set,List,Map引出的排序技巧
2011-06-24 14:18 2330一。关于概念: ... -
Date、String、Timestamp之间的转换
2011-03-20 16:59 2369public static Timestamp pars ... -
ToStringBuilder和ToStringStyle
2011-03-09 17:55 1711看完了ReflectionToStringBuilder后,发 ...
相关推荐
iso-8859-1转GBK,GBK转iso-8859-1,在二维码生成过程中如果没有用UTF8编码可以使用编码转换方式解决乱码问题
# CentOS-7-x86_64-DVD-1810.iso CentOS 7.6 DVD 版 4G http://mirrors.163.com/centos/7.6.1810/isos/x86_64/CentOS-7-x86_64-DVD-1810.iso # CentOS-7-x86_64-Everything-1810.iso CentOS 7.6 Everything版 10G ...
资源是Redhat7.4镜像文件的云盘链接,包括rhel-server-7.4-x86_64-boot.iso和rhel-server-7.4-x86_64-dvd.iso 仅供学习交流,严禁用于商业用途,请于24小时内删除
字符串编码转换方法,字符串输出对应的ASCII编码,ISO-8859-1编码,GBK编码等编码。字符串编码转换方法,字符串输出对应的ASCII编码,ISO-8859-1编码,GBK编码等编码。字符串编码转换方法,字符串输出对应的ASCII...
reverse connect command prompt
射频识别 ISO-IEC_CD-18000-6C中文版详细简析
CentOS-6.1-x86_64-bin-DVD1.iso CentOS-7-x86_64-bin-DVD2.iso CentOS-8.2-x86_64-bin-DVD1.iso 除DVD版还有各个minimal等版本提供高速下载 下载地址,提供了迅雷的高速下载通道,实测速度为31M/S,
MPEG-2_ISO-IEC_13818-3_2nd_Edition
CentOS-7.6-x86_64-DVD-1810.isoCentOS-7.6-x86_64-DVD-1810.iso
CentOS-6.1-x86_64-bin-DVD1.iso CentOS-7-x86_64-bin-DVD2.iso CentOS-8.2-x86_64-bin-DVD1.iso 除DVD版还有各个minimal等版本提供高速下载 下载地址,提供了迅雷的高速下载通道,实测速度为31M/S,
资源是Redhat7.2镜像文件的云盘链接,包括rhel-server-7.2-x86_64-boot.iso和rhel-server-7.2-x86_64-dvd.iso 仅供学习交流,严禁用于商业用途,请于24小时内删除
资源是Redhat7.3镜像文件的云盘链接,包括rhel-server-7.3-x86_64-boot.iso和rhel-server-7.3-x86_64-dvd.iso 仅供学习交流,严禁用于商业用途,请于24小时内删除
rhel-server-6.7-x86_64-dvd.iso 64位网盘下载,安装客户端,即可下载,百度网盘下载 rhel-server-6.7-x86_64-dvd.iso 64位网盘下载
ISO-14229_14229_UDS协议栈_uds-iso-14229_iso14229文档_ISO+14229_源码.zip
windows7 最新RC英文版本7100[1].0.090421-1700_x86fre_client_en-us_Retail_Ultimate-GRC1CULFRER_EN_DVD.iso [mininova]
ISO-14229_14229_UDS协议栈_uds-iso-14229_iso14229文档_ISO+14229.zip
SLE-15-SP2-Full-x86_64-GM-Media1.iso
SLES-11-DVD-x86_64-GM-DVD1.iso sles11官方iso文件的百度网盘链接。 官网和其它源已很难找到该ISO。
rhel-baseos-9.0-beta-0-x86_64-dvd.iso 网盘文件永久链接
将Janpanes文档转换为ISO-8859-1编码