如果不指定Form的Enctype属性,Form将把输入的内容依照当前页面的编码字符集u rlencode之后再提交,服务器端得到是urlencoding的字符串。编码后得到的urlencodi ng字符串是与页面的编码相关的,如gb2312编码的页面提交"中文测试",得到的是"%D6 %D0%CE%C4%B2%E2%CA%D4",每个"%"后跟的是16进制的字符串;而在UTF8编码时得到的 却是"%E4%B8%AD%E6%96%87%E6%B5%8B%E8%AF%95",因为GB2312编码中一个汉字是16位的 ,而UTF8中一个汉字却是24位的。中日韩三国的ie4以上浏览器均支持UTF8编码,这种方 案肯定包涵了这三国语言,所以我们如果让Html页面使用UTF8编码那么将至少可以支持 这三国语言。
但是,如果我们html/Jsp页面使用UTF8编码,因为应用程序服务器可能不知道这种 情况,因为如果浏览器发送的信息不包含charset信息,至多Server知道读到Accept-La nguage请求投标,我们知道仅靠这个投标是不能获知浏览器所采用编码的,所以应用程 序服务器不能正确解析提交的内容,为什么?因为Java中的所有字符串都是Unicode16位 编码的,HttpServletRequest.request(String)的功能就是把客户端提交的Urlencode编 码的信息转为Unicode字符串,有些Server只能认为客户端的编码和Server平台相同,简 单地使用URLDecoder.decode(String)方法直接解码,如果客户端编码恰好和Server相同 ,那么就可以得到正确地字符串,否则,如果提交地字符串中包含了当地字符,那么将 会导致垃圾信息。
在我提出的这个解决方案里,已经指定了采用Utf8编码,所以,可以避免这个问题 ,我们可以自己定制出decode方法: public static String decode(String s,String encoding) throws Exception { StringBuffer sb = new StringBuffer(); for(int i=0; i上一页 [1] [2] [3] [4] [5] [6] 下一页 (中华企业文化网)
|