日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

你可能也会掉进这个简单的 String 的坑

發布時間:2024/8/23 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 你可能也会掉进这个简单的 String 的坑 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


作者 | 程序猿石頭
責編 | 晉兆雨
頭圖 | 付費下載于視覺中國

關于作者:程序猿石頭(ID: tangleithu),現任阿里巴巴技術專家,清華學渣,前大疆后端 Leader。


背景

作者的同學是某大公司高級開發工程師,某日收到不少錯誤告警信息,于是便去開始排查。

跟蹤日志發現是某個服務拋出的異常信息,奇怪的是這個服務上線也有一段時間了。之前很少看到類似的錯誤信息,最近偶爾多了起來。

后來才定位到是因為服務調用了某外部接口,發現對方對參數長度做了限制,如果輸入參數超過 1000 bytes,就直接拋異常,代碼類似如下:

/***?@param?status*?@param?result,?the?size?should?less?than?1000?bytes*?@throws?Exception*/ public?XXResult(boolean?status,?String?result)?{if?(result?!=?null?&&?result.getBytes().length?>?1000)?{throw?new?RuntimeException("result?size?more?than?1000?bytes!");}...... }

心想,這還不簡單,咱們的 result 也不是什么關鍵性的東西,你有限制,我直接 trim 一下不就行了?


解決方案

于是三下五除二,給搞了個 trim 方法,支持傳不同參數按需 trim,代碼如下:

/***?將給定的字符串?trim?到指定大小*?@param?input*?@param?trimTo?需要?trim?的字節長度*?@return?trim?后的?String*/ public?static?String?trimAsByte(String?input,?int?trimTo)?{if?(Objects.isNull(input))?{return?null;}byte[]?bytes?=?input.getBytes();if?(bytes.length?>?trimTo)?{byte?[]?subArray?=?Arrays.copyOfRange(bytes,?0,?trimTo);return?new?String(subArray);}return?input; }

再在需要調用外部服務的地方,先調用這個?trimAsByte?方法,一頓操作連忙上線,一切完美~

災難現場

一切完美,作者也是這樣認為的。然后幸福總是短暫的。

經過一段時間后(前面也提到,業務場景確實是偶發的),相同的錯誤仍然發生了。

簡直不敢相信,都 trim 了為啥還會超出?你也幫忙想想,是哪里的問題?

看看上面的例子(為了方便展示,簡單修改文首代碼了下),

trimAsByte("WeChat:tangleithu",?8)

輸入字符串?WeChat:tangleithu?太長了,只 trim 到剩下 8 個字節,對應的字節數組是從?[87,101,67,104,97,116,58,116,97,110,103,108,101,105,116,104,117]?變為了?[87,101,67,104,97,116,58,116],字符串變成了?WeChat:t?,結果正確。

其實在寫這個方法的時候還是太草率了,本應該很容易想到中文的情況的,我們來試試:

trimAsByte("程序猿石頭",?8)

看上述截圖,悲劇了,輸入程序猿石頭,3 個字節一個漢字,一共 15 個字節?[-25,-88,-117,-27,-70,-113,-25,-116,-65,-25,-97,-77,-27,-92,-76],trim 到 8 位,剩下前 8 位?[-25,-88,-117,-27,-70,-113,-25,-116]?也正確。再 new String,又變成3 個 “中文” 了,雖然第 3 個“中文”,咱也不認識,咱也不敢問到底讀啥,總之再轉換成字節數組,長度多了 1 個,變成 9 了。

問題算是定位到了。


不禁要問,為什么?

來看看這個 String 的構造函數,看看上面注釋才發現,其實我們忽略了一個很重要的概念,就是編碼方式。

/***?Constructs?a?new?{@code?String}?by?decoding?the?specified?array?of?bytes*?using?the?platform's?default?charset.??The?length?of?the?new?{@code*?String}?is?a?function?of?the?charset,?and?hence?may?not?be?equal?to?the*?length?of?the?byte?array.**?<p>?The?behavior?of?this?constructor?when?the?given?bytes?are?not?valid*?in?the?default?charset?is?unspecified.??The?{@link*?java.nio.charset.CharsetDecoder}?class?should?be?used?when?more?control*?over?the?decoding?process?is?required.**?@param??bytes*?????????The?bytes?to?be?decoded?into?characters**?@since??JDK1.1*/ public?String(byte?bytes[])?{//this(bytes,?0,?bytes.length);checkBounds(bytes,?offset,?length);this.value?=?StringCoding.decode(bytes,?offset,?length); }

當我們用默認的構造函數 new String 的時候,只是用了系統默認的編碼(本文是“UTF-8”)去嘗試解碼,構造出字符串。

所以,當我們在用字節數組(字節流)來表達具體的語義的時候,一定要約定好以什么方式進行編碼,本文不具體闡述編碼問題了。下面用一個例子來解釋上文的現象:

[-25,-88,-117,-27,-70,-113,-25,-116,-65,-25,-97,-77,-27,-92,-76] 仍然用這串字節數組來實驗,這串字節數組,如果用 “UTF-8” 編碼去解釋,那么其想表達的語義就是中文“程序猿石頭”,從上文標注的 1,2,3 中可以看出來,沒有寫即用了系統中的默認編碼“UTF-8”。

假設按照 “GBK” 來解釋(標注 4),就是表達的 “紼嬪簭鐚跨煶澶�”,注意看下其中的?�?是不是似曾相識;

注意標注 5,通過 GBK 解釋構造字符串后,再通過默認的 “UTF-8” 獲取字節數組,長度就變成 24 了,然后還通過 “GBK” 編碼得到的字節數組長度為 15(標注 6),再試圖構造字符串(標注 7),其中“程序猿石頭”的“頭”字,已經沒了。說明這個轉換過程中,其實信息已經被丟了。

上面的?�?其實是 UNICODE 編碼方式中的一個特殊的字符,也就是 0xFFFD(65535),其實是一個占位符(REPLACEMENT CHARACTER),用來表達未知的、沒辦法表達的東東。上文中在進行編碼轉換過程中,出現了這個玩意,其實也就是沒辦法準確表達含義,會被替換成這個東西,因此信息也就丟失了。你可以試試前面的例子,比如把前 8 個字節中的最后一兩個字節隨便改改,都是一樣的。

程序猿石頭:65533 示例


總結

總結一下,其實本來是一個很簡單的問題,卻經過幾次修改才最終解決,說明對 “基礎” 掌握得還是不夠,一個重要的點是,在處理二進制數據的時候,一定要聯想到 “編碼” 方式。

另外,提醒我們,看似簡單的問題,我們往往容易忽略。比如如果單純看到文中提到的這個trim 方法,其實很容易寫個單元測試就能盡早發現有問題;

更多閱讀推薦

  • 大神們都是如何在時間序列中進行特征提取的?看完就懂了!

  • 億級大表分庫分表實戰總結(萬字干貨,實戰復盤)

  • 贈書 | 華為數據底座的整體架構與建設策略

  • 區塊鏈和大數據一起能否開啟數據完整性的新紀元?

  • ?情感 AI,再不涉獵就要晚了

創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的你可能也会掉进这个简单的 String 的坑的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 在线国产福利 | 国产精品视频久久久 | 九一在线观看免费高清视频 | 美女视频久久 | 中文字幕精品一区二区三区精品 | 亚洲 欧洲 日韩 | 青青草国产在线播放 | 五月婷在线视频 | 久久久999精品视频 国产在线xx | 大学生一级片 | 美女屁股网站 | 全部孕妇毛片 | 手机看黄色 | 欧美国产精品一二三 | va视频在线观看 | 韩国一区视频 | 亚洲人成亚洲人成在线观看 | www.sesehu.com | 99精品国产一区二区 | av55 | 免费高清av在线看 | 中国挤奶哺乳午夜片 | 中文字幕一区二区三区手机版 | 精品人妻二区中文字幕 | 男女啪啪免费看 | 人妖被c到高潮欧美gay | 黄色片视频免费在线观看 | 日本a在线播放 | 99精品免费在线观看 | 国产精品成人国产乱一区 | 人人妻人人澡人人爽欧美一区 | 四虎在线播放 | 被灌满精子的波多野结衣 | 岛国av在线 | 高清成人 | 亚洲一区二区三区四区在线 | 性高湖久久久久久久久aaaaa | 500福利视频导航 | 国产一区麻豆 | 一道本在线 | 亚洲成人播放器 | 嫩草影院一区 | 健身教练巨大粗爽gay视频 | 猛男大粗猛爽h男人味 | 日本精品一区二区在线观看 | 99视屏 | 成人午夜视频在线 | 生活片毛片 | 欧洲女女同性videoso | 中文字幕一区二区三区四区欧美 | 久久精品123 | 熟女熟妇伦久久影院毛片一区二区 | 夜夜操影视 | 蜜臀一区二区三区精品免费视频 | 影音先锋中文字幕在线播放 | 国产主播精品在线 | 五月天色视频 | 中文字幕一二三 | 国产伦理吴梦梦伦理 | 一级黄色大片免费 | 精品一区二区三区入口 | 色亚洲影院| 神马久久av | 不卡视频一区 | 荒野求生21天去码版网站 | 日韩精品人妻无码一本 | 国产精品第2页 | h视频网站在线观看 | 一区二区三区视频在线播放 | 中国在线观看片免费 | 成人国产精品一区二区 | 噜噜噜久久,亚洲精品国产品 | 亚洲成人av电影在线 | 久艹伊人| 台湾佬久久 | 精品区一区二区 | 亚洲色图13p | 国产18页 | 人妻精品一区二区在线 | 日韩精品h| 天天爽夜夜爽一区二区三区 | 精品日韩| 国产精品一区不卡 | 秋霞国产午夜精品免费视频 | 热久久国产 | 黑帮大佬和我的365日第二部 | 国产牛牛 | 97精品久久人人爽人人爽 | 91精品国产成人 | 国产女主播在线观看 | 毛片女人| 在线碰 | 久久久久一区二区三区 | 人人干av | 我爱av好色 | 一个色综合网 | 奇米影视777第四色 2019中文字幕在线免费观看 | 亚洲大片免费观看 | 对白超刺激精彩粗话av | 国产精品无码久久久久一区二区 |