日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【数据结构与算法】字符串匹配 AC自动机

發(fā)布時間:2023/12/10 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【数据结构与算法】字符串匹配 AC自动机 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
  • 單模式串匹配
    BF 算法和 RK 算法
    BM 算法和 KMP 算法
  • 多模式串匹配算法
    Trie 樹和 AC 自動機
  • AC 自動機

    AC 自動機實際上就是在 Trie 樹之上,加了類似 KMP 的 next 數(shù)組,只不過此處的 next 數(shù)組是構(gòu)建在樹上罷了。

    AC 自動機的構(gòu)建

    • 將多個模式串構(gòu)建成 Trie 樹;
    • -在 Trie 樹上構(gòu)建失敗指針(相當(dāng)于 KMP 中的失效函數(shù) next 數(shù)組)。
    public void buildFailurePointer() {Queue<AcNode> queue = new LinkedList<>();root.fail = null;queue.add(root);while (!queue.isEmpty()) {AcNode p = queue.remove();for (int i = 0; i < 26; ++i) {AcNode pc = p.children[i];if (pc == null) continue;if (p == root) {pc.fail = root;} else {AcNode q = p.fail;while (q != null) {AcNode qc = q.children[pc.data - 'a'];if (qc != null) {pc.fail = qc;break;}q = q.fail;}if (q == null) {pc.fail = root;}}queue.add(pc);}} }

    AC 自動機的匹配

    public void match(char[] text) { // text是主串int n = text.length;AcNode p = root;for (int i = 0; i < n; ++i) {int idx = text[i] - 'a';while (p.children[idx] == null && p != root) {p = p.fail; // 失敗指針發(fā)揮作用的地方}p = p.children[idx];if (p == null) p = root; // 如果沒有匹配的,從root開始重新匹配AcNode tmp = p;while (tmp != root) { // 打印出可以匹配的模式串if (tmp.isEndingChar == true) {int pos = i-tmp.length+1;System.out.println("匹配起始下標" + pos + "; 長度" + tmp.length);}tmp = tmp.fail;}} }

    時間復(fù)雜度

    AC 自動機算法包含兩個部分,第一部分是將多個模式串構(gòu)建成 AC 自動機,第二部分是在 AC 自動機中匹配主串。第一部分又分為兩個小的步驟,一個是將模式串構(gòu)建成 Trie 樹,另一個是在 Trie 樹上構(gòu)建失敗指針。
    將多個模式串構(gòu)建成 AC 自動機
    Trie 樹構(gòu)建的時間復(fù)雜度是 O(mlen),其中 len 表示敏感詞的平均長度,m 表示敏感詞的個數(shù)。
    每個節(jié)點構(gòu)建失敗指針的時間復(fù)雜度是 O(len)。整個失敗指針的構(gòu)建過程就是 O(klen)。
    AC 自動機做匹配
    for 循環(huán)依次遍歷主串中的每個字符,for 循環(huán)內(nèi)部最耗時的部分也是 while 循環(huán),而這一部分的時間復(fù)雜度也是 O(len),所以總的匹配的時間復(fù)雜度就是 O(n*len)。
    實際情況下,可能近似于 O(n),所以 AC 自動機做敏感詞過濾,性能非常高。

    總結(jié)

    以上是生活随笔為你收集整理的【数据结构与算法】字符串匹配 AC自动机的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。