C/C++笔记(04):GB2312字符串和UTF-8之间的转换
生活随笔
收集整理的這篇文章主要介紹了
C/C++笔记(04):GB2312字符串和UTF-8之间的转换
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
在編程過程中需要對(duì)字符串進(jìn)行不同的轉(zhuǎn)換,特別是Gb2312和Utf-8直接的轉(zhuǎn)換。
在幾個(gè)開源的魔獸私服中,很多都是國(guó)外開發(fā)的,而暴雪為了能夠兼容世界上的各個(gè)字符集也使用了UTF-8。在中國(guó)使用VS(VS2005以上版本)開發(fā)基本都是使用Gb2312的Unicode字符集,所以當(dāng)在編程過程中就需要進(jìn)行字符轉(zhuǎn)換,這樣才能兼容游戲,否則就是亂碼。而在控制臺(tái)顯示字符串時(shí),正好相反需要將UTF-8的字符串轉(zhuǎn)換成Gb2312才能正常顯示。
為了解決這個(gè)問題,轉(zhuǎn)換如下;其實(shí)很多地方都可以使用到字符串的編碼轉(zhuǎn)換,代碼如下:
// UTF-8到GB2312的轉(zhuǎn)換 char* U2G(const char* utf8) { int len = MultiByteToWideChar(CP_UTF8, 0, utf8, -1, NULL, 0); wchar_t* wstr = new wchar_t[len+1]; memset(wstr, 0, len+1); MultiByteToWideChar(CP_UTF8, 0, utf8, -1, wstr, len); len = WideCharToMultiByte(CP_ACP, 0, wstr, -1, NULL, 0, NULL, NULL); char* str = new char[len+1]; memset(str, 0, len+1); WideCharToMultiByte(CP_ACP, 0, wstr, -1, str, len, NULL, NULL); if(wstr) delete[] wstr; return str; } 復(fù)制代碼// GB2312到UTF-8的轉(zhuǎn)換 char* G2U(const char* gb2312) { int len = MultiByteToWideChar(CP_ACP, 0, gb2312, -1, NULL, 0); wchar_t* wstr = new wchar_t[len+1]; memset(wstr, 0, len+1); MultiByteToWideChar(CP_ACP, 0, gb2312, -1, wstr, len); len = WideCharToMultiByte(CP_UTF8, 0, wstr, -1, NULL, 0, NULL, NULL); char* str = new char[len+1]; memset(str, 0, len+1); WideCharToMultiByte(CP_UTF8, 0, wstr, -1, str, len, NULL, NULL); if(wstr) delete[] wstr; return str; } 復(fù)制代碼無論是GB2312到UTF-8的轉(zhuǎn)換,還是UTF-8到GB2312的轉(zhuǎn)換,都需要注意的是在使用字符串后,需要?jiǎng)h除字符串指針;這是因?yàn)橐陨蟽蓚€(gè)方法返回的是字符串指針,如果沒有刪除將會(huì)內(nèi)存泄漏。
總結(jié)
以上是生活随笔為你收集整理的C/C++笔记(04):GB2312字符串和UTF-8之间的转换的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 行冗余
- 下一篇: ArcGIS 复制要素