當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

南邮哈夫曼编码c语言代码_漫画：“哈夫曼编码” 是什么鬼？

發布時間：2023/12/10 编程问答 29 豆豆

生活随笔收集整理的這篇文章主要介紹了南邮哈夫曼编码c语言代码_漫画：“哈夫曼编码” 是什么鬼？小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?在上一期，我們介紹了一種特殊的數據結構 “哈夫曼樹”，也被稱為最優二叉樹。沒看過的小伙伴可以點擊下方鏈接：

漫畫：什么是 “哈夫曼樹” ？

那么，這種數據結構究竟有什么用呢？我們今天就來揭曉答案。

計算機系統是如何存儲信息的呢？

計算機不是人，它不認識中文和英文，更不認識圖片和視頻，它唯一“認識”的就是0（低電平）和1（高電平）。

因此，我們在計算機上看到的一切文字、圖像、音頻、視頻，底層都是用二進制來存儲和傳輸的。

從狹義上來講，把人類能看懂的各種信息，轉換成計算機能夠識別的二進制形式，被稱為編碼。

編碼的方式可以有很多種，我們大家最熟悉的編碼方式就屬ASCII碼了。

在ASCII碼當中，把每一個字符表示成特定的8位二進制數，比如：

顯然，ASCII碼是一種等長編碼，也就是任何字符的編碼長度都相等。

為什么這么說呢？讓我們來看一個例子：

假如一段信息當中，只有A，B，C，D，E，F這6個字符，如果使用等長編碼，我們可以把每一個字符都設計成長度為3的二進制編碼：

如此一來，給定一段信息 “ABEFCDAED”，就可以編碼成二進制的 “000 001 100 101 010 011 000 100 011”，編碼總長度是27。

但是，這樣的編碼方式是最優的設計嗎？如果我們讓不同的字符對應不同長度的編碼，結果會怎樣呢？比如：

如此一來，給定的信息 “ABEFCDAED”，就可以編碼成二進制的 “0 00 10 11 01 1 0 10 1”，編碼的總長度只有14。

哈夫曼編碼(Huffman Coding)，同樣是由麻省理工學院的哈夫曼博所發明，這種編碼方式實現了兩個重要目標：

1.任何一個字符編碼，都不是其他字符編碼的前綴。

2.信息編碼的總長度最小。

哈夫曼編碼的生成過程是什么樣子呢？讓我們看看下面的例子：

假如一段信息里只有A，B，C，D，E，F這6個字符，他們出現的次數依次是2次，3次，7次，9次，18次，25次，如何設計對應的編碼呢？

我們不妨把這6個字符當做6個葉子結點，把字符出現次數當做結點的權重，以此來生成一顆哈夫曼樹：

這樣做的意義是什么呢？

哈夫曼樹的每一個結點包括左、右兩個分支，二進制的每一位有0、1兩種狀態，我們可以把這兩者對應起來，結點的左分支當做0，結點的右分支當做1，會產生什么樣的結果？

這樣一來，從哈夫曼樹的根結點到每一個葉子結點的路徑，都可以等價為一段二進制編碼：

上述過程借助哈夫曼樹所生成的二進制編碼，就是哈夫曼編碼。

現在，我們面臨兩個關鍵的問題：

首先，這樣生成的編碼有沒有前綴問題帶來的歧義呢？答案是沒有歧義。

因為每一個字符對應的都是哈夫曼樹的葉子結點，從根結點到這些葉子結點的路徑并沒有包含關系，最終得到的二進制編碼自然也不會是彼此的前綴。

其次，這樣生成的編碼能保證總長度最小嗎？答案是可以保證。

哈夫曼樹的重要特性，就是所有葉子結點的（權重 X 路徑長度）之和最小。

放在信息編碼的場景下，葉子結點的權重對應字符出現的頻次，結點的路徑長度對應字符的編碼長度。

所有字符的（頻次 X 編碼長度）之和最小，自然就說明總的編碼長度最小。

private Node root;

private Node[] nodes;

//構建哈夫曼樹

public void createHuffmanTree(int[] weights) {

//優先隊列，用于輔助構建哈夫曼樹

Queue<Node> nodeQueue = new PriorityQueue<>();

nodes = new Node[weights.length];

//構建森林，初始化nodes數組

for(int i=0; i<weights.length; i++){

nodes[i] = new Node(weights[i]);

nodeQueue.add(nodes[i]);

}

//主循環，當結點隊列只剩一個結點時結束

while (nodeQueue.size() > 1) {

//從結點隊列選擇權值最小的兩個結點

Node left = nodeQueue.poll();

Node right = nodeQueue.poll();

//創建新結點作為兩結點的父節點

Node parent = new Node(left.weight + right.weight, left, right);

nodeQueue.add(parent);

}

root = nodeQueue.poll();

}

//輸入字符下表，輸出對應的哈夫曼編碼

public String convertHuffmanCode(int index) {

return nodes[index].code;

}

//用遞歸的方式，填充各個結點的二進制編碼

public void encode(Node node, String code){

if(node == null){

return;

}

node.code = code;

encode(node.lChild, node.code+"0");

encode(node.rChild, node.code+"1");

}

public static class Node implements Comparable<Node>{

int weight;

//結點對應的二進制編碼

String code;

Node lChild;

Node rChild;

public Node(int weight) {

this.weight = weight;

}

public Node(int weight, Node lChild, Node rChild) {

this.weight = weight;

this.lChild = lChild;

this.rChild = rChild;

}

@Override

public int compareTo(Node o) {

return new Integer(this.weight).compareTo(new Integer(o.weight));

}

public static void main(String[] args) {

char[] chars = {'A','B','C','D','E','F'};

int[] weights = {2,3,7,9,18,25};

HuffmanCode huffmanCode = new HuffmanCode();

huffmanCode.createHuffmanTree(weights);

huffmanCode.encode(huffmanCode.root, "");

for(int i=0; i<chars.length; i++){

System.out.println(chars[i] +":" + huffmanCode.convertHuffmanCode(i));

}

這段代碼中，Node類增加了一個新字段code，用于記錄結點所對應的二進制編碼。

當哈夫曼樹構建之后，就可以通過遞歸的方式，從根結點向下，填充每一個結點的code值。

在公眾號后臺回復“學習視頻”，可以獲得海量免費的IT視頻課程哦~~

總結

以上是生活随笔為你收集整理的南邮哈夫曼编码c语言代码_漫画：“哈夫曼编码” 是什么鬼？的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：生动形象！一个故事讲完CPU的工作原理
下一篇： R7000刷梅林固件一个小结(变砖解决)