DBMNG数据库管理与应用

科学是实事求是的学问,来不得半点虚假。
当前位置:首页 > 经验分享 > Java开发

java自动判断获取到的中文字符串是否乱码

/**  
         *  用getBytes(encoding):返回字符串的一个byte数组  
         *  当b[0]为  63时,应该是转码错误  
         *  A、不乱码的汉字字符串:  
         *  1、encoding用GB2312时,每byte是负数;  
         *  2、encoding用ISO8859_1时,b[i]全是63。  
         *  B、乱码的汉字字符串:  
         *  1、encoding用ISO8859_1时,每byte也是负数;  
         *  2、encoding用GB2312时,b[i]大部分是63。  
         *  C、英文字符串  
         *  1、encoding用ISO8859_1和GB2312时,每byte都大于0;  
         *  总结:给定一个字符串,用getBytes("iso8859_1")  
         *  1、如果b[i]有63,不用转码;  A-2  
         *  2、如果b[i]全大于0,那么为英文字符串,不用转码;  B-1  
         *  3、如果b[i]有小于0的,那么已经乱码,要转码。  C-1  
         */ 

 
private  static  String  toGb2312(String  str)  { 
               if  (str  ==  null)  return  null; 
               String  retStr  =  str; 
               byte  b[]; 
               try  { 
                       b  =  str.getBytes("ISO8859_1");
                       for  (int  i  =  0;  i  <  b.length;  i++)  { 
                               byte  b1  =  b[i]; 
                               if  (b1  ==  63) 
                                       break;    //1 
                               else  if  (b1  >  0) 
                                       continue;//2 
                               else  if  (b1  <  0)  {        //不可能为0,0为字符串结束符
//小于0乱码
                                       retStr  =  new  String(b,  "UTF-8");//或当前所用的编码形式 
                                       break; 
                               } 
                       } 
               }  catch  (UnsupportedEncodingException  e)  { 
                       //  e.printStackTrace();  
               } 
               return  retStr; 
       } 
本站文章内容,部分来自于互联网,若侵犯了您的权益,请致邮件chuanghui423#sohu.com(请将#换为@)联系,我们会尽快核实后删除。
Copyright © 2006-2023 DBMNG.COM All Rights Reserved. Powered by DEVSOARTECH            豫ICP备11002312号-2

豫公网安备 41010502002439号