當前位置：首頁 > 编程语言 > java >内容正文

java

Java去除使用富文本编辑器时自动生成的标签

發布時間：2023/12/14 java 22 豆豆

生活随笔收集整理的這篇文章主要介紹了 Java去除使用富文本编辑器时自动生成的标签小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1,最近做了一個個人博客項目，使用了一個富文本編輯器，然后遇到了一個問題。我們都知道，富文本編輯器編輯的文本都是有格式，顏色之類的，而實際上在數據庫中存儲的不僅僅是你寫的文章的內容，還有富文本編輯器自己形成的HTML標簽，這些標簽使富文本編輯器中的內容各式各樣，即實現富文本。比如，你在富文本編輯器中寫了一個文本“Long Bro博客”，并設定其為斜體粗體，那么雖然富文本編輯器顯示的仍是“Long Bro博客”，但通過它存儲到數據庫中的文本內容不僅僅有“Long Bro博客”，還有這個字體的粗體及斜體格式，即“Long Bro博客”。

2,使用富文本編輯器寫的博文存儲到數據庫后，就可以使用Javaweb的JSP及Servlet中的out.println()方法通過訪問數據庫向瀏覽器輸出數據庫中的數據，輸出時會自動按照標簽的格式來輸出，即以指定格式輸出文本。

3，但是，在有些地方，我們不需要它按這種格式輸出文本。如果按這種格式輸出，反而使標簽與標簽產生沖突，造成不可逆轉的后果，比如如下的博客列表展示界面（以下只截了一篇作為例子）只需要展示博客的一部分，也不必按格式顯示，如果不去除數據庫中的標簽它反而可能會與頁面中其他標簽（圖中的“閱讀原文”，時間，作者等）相沖突，造成界面顯示混亂的結果。那么這個時候，就需要做一件事情了---去除HTML標簽。

4，那么問題來了，該怎么做才能將博文中的HTML標簽去掉呢，啰嗦了半天，接下來進入本篇博文的重點。

String content=rs.getString("content");//content為從數據庫獲取的包含標簽的博文內容 content=content.replaceAll("<[.[^<]]*>", "");//使用String的replaceAll方法將標簽去掉，注意里面的參數

通過String類的replaceAll方法將博文內容中的標簽去掉。第一個參數為要替換的內容，第二個參數為替換成的內容。如上代碼的意思就是將所有標簽替換為一個空字符串。

5，普及一個與本篇博文無關的常識，在HTML中使用<xmp></xmp>標簽可以自動忽略其中的標簽，將內容按原本輸出，即段落會輸出：段落

好了，今天的博客寫到這里就進入尾聲了，感謝大家的觀看。有錯誤的地方歡迎各位評論指正，小編在這里向大家表示感謝。歡迎大家訪問我的博客網站---Long Bro博客，我在這兒等著你^~^

總結

以上是生活随笔為你收集整理的Java去除使用富文本编辑器时自动生成的标签的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。