Java去除使用富文本编辑器时自动生成的标签
1,最近做了一個個人博客項目,使用了一個富文本編輯器,然后遇到了一個問題。我們都知道,富文本編輯器編輯的文本都是有格式,顏色之類的,而實際上在數據庫中存儲的不僅僅是你寫的文章的內容,還有富文本編輯器自己形成的HTML標簽,這些標簽使富文本編輯器中的內容各式各樣,即實現富文本。比如,你在富文本編輯器中寫了一個文本“Long Bro博客”,并設定其為斜體粗體,那么雖然富文本編輯器顯示的仍是“Long Bro博客”,但通過它存儲到數據庫中的文本內容不僅僅有“Long Bro博客”,還有這個字體的粗體及斜體格式,即“<b><i>Long Bro博客</i></b>”。
2,使用富文本編輯器寫的博文存儲到數據庫后,就可以使用Javaweb的JSP及Servlet中的out.println()方法通過訪問數據庫向瀏覽器輸出數據庫中的數據,輸出時會自動按照標簽的格式來輸出,即以指定格式輸出文本。
3,但是,在有些地方,我們不需要它按這種格式輸出文本。如果按這種格式輸出,反而使標簽與標簽產生沖突,造成不可逆轉的后果,比如如下的博客列表展示界面(以下只截了一篇作為例子)只需要展示博客的一部分,也不必按格式顯示,如果不去除數據庫中的標簽它反而可能會與頁面中其他標簽(圖中的“閱讀原文”,時間,作者等)相沖突,造成界面顯示混亂的結果。那么這個時候,就需要做一件事情了---去除HTML標簽。
4,那么問題來了,該怎么做才能將博文中的HTML標簽去掉呢,啰嗦了半天,接下來進入本篇博文的重點。
String content=rs.getString("content");//content為從數據庫獲取的包含標簽的博文內容 content=content.replaceAll("<[.[^<]]*>", "");//使用String的replaceAll方法將標簽去掉,注意里面的參數通過String類的replaceAll方法將博文內容中的標簽去掉。第一個參數為要替換的內容,第二個參數為替換成的內容。如上代碼的意思就是將所有標簽替換為一個空字符串。
5,普及一個與本篇博文無關的常識,在HTML中使用<xmp></xmp>標簽可以自動忽略其中的標簽,將內容按原本輸出,即<p>段落</p>會輸出:<p>段落</p>
好了,今天的博客寫到這里就進入尾聲了,感謝大家的觀看。有錯誤的地方歡迎各位評論指正,小編在這里向大家表示感謝。歡迎大家訪問我的博客網站---Long Bro博客,我在這兒等著你^~^
總結
以上是生活随笔為你收集整理的Java去除使用富文本编辑器时自动生成的标签的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SwiftyJSON之使用分析
- 下一篇: 使用文本编辑器编写Java源代码