国际化组件 Unicode (ICU) 函数库
ICU (International Components for Unicode)是為軟件應用提供Unicode和全球化支持的一套成熟、廣泛使用的C/C++、Java和.NET 類庫集,可在所有平臺的C/C++、Java和C# 軟件上獲得一致的結(jié)果,用于支持軟件國際化的開源項目, 軟件開發(fā)者幾乎可以使用ICU 解決任何國際化的問題,根據(jù)各地的風俗和語言習慣,實現(xiàn)對數(shù)字、貨幣、時間、日期、和消息的格式化、解析,對字符串進行大小寫轉(zhuǎn)換、整理、搜索和排序等功能。ICU的主頁是http://www.icu-project.org/
ICU首先是由Taligent公司開發(fā)的,Taligent公司被合并為IBM公司全球化認證中心的Unicode研究組后,ICU由IBM和開源組織合作繼續(xù)開發(fā)。開始ICU只有Java平臺的版本,后來這個平臺下的ICU類被吸納入SUN公司開發(fā)的JDK1.1,并在JDK以后的版本中不斷改進。C++和C平臺下的ICU是由JAVA平臺下的ICU移植過來的,移植過的版本被稱為ICU4C,來支持這C/C++兩個平臺下的國際化應用。ICU4J和ICU4C區(qū)別不大,但由于ICU4C是開源的,并且緊密跟進Unicode標準,ICU4C支持的Unicode標準總是最新的;同時,因為JAVA平臺的ICU4J的發(fā)布需要和JDK綁定,ICU4C支持Unicode標準改變的速度要比ICU4J快的多。在Linux 操作系統(tǒng)上,.NET Core 使用ICU的全球化API, 從 .NET 5.0 開始,如果應用在 Windows 10 2019 年 5 月更新或更高版本上運行,.NET 庫將使用 ICU 全球化 API。.NET 5 統(tǒng)一使用ICU, 引入此更改的原因有兩個:
應用跨平臺(包括 Linux、macOS 和 Windows)具有相同的全球化行為。
應用可以通過使用自定義 ICU 庫來控制全球化行為。
ICU的功能主要有:
代碼頁轉(zhuǎn)換: 對文本數(shù)據(jù)進行Unicode、幾乎任何其他字符集或編碼的相互轉(zhuǎn)換。ICU的轉(zhuǎn)化表基于IBM過去幾十年收集的字符集數(shù)據(jù),在世界各地都是最完整的。
排序規(guī)則(Collation): 根據(jù)特定語言、區(qū)域或國家的管理和標準比較字數(shù)串。ICU的排序規(guī)則基于Unicode排序規(guī)則算法加上來自公共區(qū)域性數(shù)據(jù)倉庫(Common locale data repository)的區(qū)域特定比較規(guī)則。
格式化: 根據(jù)所選區(qū)域設置的慣例,實現(xiàn)對數(shù)字、貨幣、時間、日期、和利率的格式化。包括將月和日名稱轉(zhuǎn)換成所選語言、選擇適當縮寫、正確對字段進行排序等。這些數(shù)據(jù)也取自公共區(qū)域性數(shù)據(jù)倉庫。
時間計算: 在傳統(tǒng)格里歷基礎上提供多種歷法。提供一整套時區(qū)計算API。
Unicode支持: ICU緊密跟進Unicode標準,通過它可以很容易地訪問Unicode標準制定的很多Unicode字符屬性、Unicode規(guī)范化、大小寫轉(zhuǎn)換和其他基礎操作。
正則表達式: ICU的正則表達式全面支持Unicode并且性能極具競爭力。
Bidi: 支持不同文字書寫順序混合文字(例如從左到右書寫的英語,或者從右到左書寫的阿拉伯文和希伯來文)的處理。
文本邊界: 在一段文本內(nèi)定位詞、句或段落位置、或標識最適合顯示文本的自動換行位置。
參考:
https://docs.microsoft.com/zh-cn/dotnet/core/compatibility/globalization
總結(jié)
以上是生活随笔為你收集整理的国际化组件 Unicode (ICU) 函数库的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何做好一个开源项目之徽章(二)
- 下一篇: 将微服务部署到 Azure Kubern