C#如何解决中按字节数截取字符串最后出现乱码问题
这篇文章主要介绍C#如何解决中按字节数截取字符串最后出现乱码问题,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
创新互联专注于企业成都全网营销、网站重做改版、镶黄网站定制设计、自适应品牌网站建设、html5、商城系统网站开发、集团公司官网建设、成都外贸网站建设公司、高端网站制作、响应式网页设计等建站业务,价格优惠性价比高,为镶黄等各大城市提供网站开发制作服务。
前言
最近需要用到按字节数截取字符串。在网上找了很多方法。
Encoding.Default.GetString采用的Default
Encoding.UTF8.GetBytes采用的是utf-8编码。这样当然是乱码。尤其出现中文时候。
对这类数据处理当然要用统一的编码来处理。下面话不多说了,来一起看看详细的介绍吧
例子:1
string msg= Encoding.UTF8.GetString(Encoding.UTF8.GetBytes(strcode));
例子:2
string strcode="我是小明"; byte[] buffer=Encoding.UTF8.GetBytes(strcode); string msg= Encoding.UTF8.GetString(buffer,0,buffer.Length);
实际结果是截取的结尾会出现乱码。原因是最后的字符是多个字节,被不完整的截取了。
改进后的办法如下:
////// 按字节数截取字符串的方法(比SubString好用) /// /// 要截取的字符串(可空) /// 要截取的字节数 /// System.Text.Encoding /// 结果字符串的后缀(超出部分显示为该后缀) ///public static string SubStringByBytes(string source, int NumberOfBytes, System.Text.Encoding encoding, string suffix = "...") { if(string.IsNullOrWhiteSpace(source) || source.Length == 0) return source; if(encoding.GetBytes(source).Length <= NumberOfBytes) return source; long tempLen = 0; StringBuilder sb = new StringBuilder(); foreach(var c in source) { Char[] _charArr = new Char[] { c }; byte[] _charBytes = encoding.GetBytes(_charArr); if((tempLen + _charBytes.Length) > NumberOfBytes) { if(!string.IsNullOrWhiteSpace(suffix)) sb.Append(suffix); break; } else { tempLen += _charBytes.Length; sb.Append(encoding.GetString(_charBytes)); } } return sb.ToString(); } /// /// 按字节数截取字符串的方法(比SubString好用) /// /// 要截取的字符串(可空) /// 要截取的字节数 /// UTF-8,Unicode,GB2312... /// 结果字符串的后缀(超出部分显示为该后缀) ///public static string SubStringByBytes(string source, int NumberOfBytes, string encoding = "UTF-8", string suffix = "...") { return SubStringByBytes(source, NumberOfBytes, Encoding.GetEncoding(encoding), suffix); }
原理很简单,就是截取之前逐个先判断字符是否超出字节长度,如果超出则扔掉整个字符。
在JavaScript里面的Blob对象很容易获取字节长度: var len= new Blob(['字符串']).size;
以上是“C#如何解决中按字节数截取字符串最后出现乱码问题”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注创新互联行业资讯频道!
分享标题:C#如何解决中按字节数截取字符串最后出现乱码问题
本文路径:http://scyanting.com/article/igegie.html