Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Huffman算法压缩解压缩(C)

Huffman算法压缩解压缩(C)

作者头像
FPGA开源工作室
发布于 2024-07-06 00:04:01
发布于 2024-07-06 00:04:01
27000
代码可运行
举报
文章被收录于专栏:FPGA开源工作室FPGA开源工作室
运行总次数:0
代码可运行
1 概述

Huffman压缩算法是一种基于字符出现频率的编码算法,通过构建Huffman树,将出现频率高的字符用短编码表示,出现频率低的字符用长编码表示,从而实现对数据的压缩。以下是Huffman压缩算法的详细流程: 统计字符频率:遍历待压缩的数据,统计每个字符出现的频率。 构建优先队列:将每个字符及其频率作为一个结点放入优先队列(或最小堆)中,根据字符频率构建一个按频率大小排序的优先队列。 构建Huffman树:不断地从优先队列中取出频率最小的两个结点,合并为一个新结点,并将新结点重新插入到优先队列中,直到队列只剩下一个结点,即Huffman树的根结点。 生成Huffman编码:通过遍历Huffman树,从根结点到每个叶子结点的路径上的左右分支分别对应编码0和1,根据路径生成每个字符的Huffman编码。 压缩数据:根据生成的Huffman编码,将待压缩数据中的每个字符替换为对应的Huffman编码,得到压缩后的数据。 存储压缩表:将字符与对应的Huffman编码关系存储为压缩表,以便解压缩时使用。 存储压缩数据:将压缩后的数据以二进制形式存储。 在解压缩时,需要根据存储的Huffman编码表和压缩数据,使用相同的Huffman树结构进行解码,将压缩数据解压缩成原始数据,并输出原始数据。 Huffman压缩算法的优势在于可以根据数据的特征自适应地确定编码,使得出现频率高的字符拥有更短的编码,从而实现高效的数据压缩。然而,Huffman算法对于小规模数据压缩效果不佳,适用于处理较大规模的数据压缩。

2 huffman压缩算法过程详细演示

下面将通过一个简单的例子来演示Huffman压缩算法的压缩过程,假设有一个字符串 “ABRACADABRA” 需要进行压缩。

  1. 统计字符频率:

A: 5 次 B: 2 次 R: 2 次 C: 1 次 D: 1 次 2) 构建优先队列: 构建一个优先队列,按照字符频率排序:

(C, 1), (D, 1), (B, 2), (R, 2), (A, 5) 3) 构建Huffman树: 不断地从优先队列中取出频率最小的两个结点,合并为一个新节点,并重新插入队列中,直到队列只剩下一个节点,作为Huffman树的根节点。

  1. 合并过程:

(C, 1)和(D, 1) -> (CD, 2) (B, 2)和(R, 2) -> (BR, 4) ((CD, 2) 和 (BR, 4)) -> ((CD)BR, 6) ((A, 5) 和 ((CD)BR, 6)) -> (((CD)BR)A, 11) 最终得到的Huffman树如下: (((CD)BR)A) / (CD)BR A / CD BR / \ / C D B R

  1. 生成Huffman编码: 从根节点开始,左分支为0,右分支为1,生成每个字符的Huffman编码:

A: 0 B: 101 R: 100 C: 1100 D: 1101 6) 压缩数据: 将原始数据字符串 “ABRACADABRA” 中的每个字符使用对应的Huffman编码替换,得到压缩后的数据。

原始数据:ABRACADABRA Huffman编码:010110011001011010001011110 压缩后数据:010110011001011010001011110

在实际压缩过程中,还需要将Huffman编码表(字符与编码的映射关系)一并存储,以便在解压缩时使用。通过上述过程,原始数据被成功压缩,并且根据Huffman编码,高频字符编码较短,低频字符编码较长,实现了数据的有效压缩。

3 c语言Huffman压缩代码示例

以下是一个简单的C语言示例代码,实现了Huffman算法进行数据压缩和解压缩的功能:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define MAX_TREE_HT 100

// 结点结构体
typedef struct MinHeapNode {
    char data;
    unsigned freq;
    struct MinHeapNode *left, *right;
} MinHeapNode;

// 最小堆结构体
typedef struct MinHeap {
    unsigned size;
    unsigned capacity;
    MinHeapNode **array;
} MinHeap;

// 创建新结点
MinHeapNode* newNode(char data, unsigned freq) {
    MinHeapNode* node = (MinHeapNode*)malloc(sizeof(MinHeapNode));
    node->left = node->right = NULL;
    node->data = data;
    node->freq = freq;
    return node;
}

// 创建最小堆
MinHeap* createMinHeap(unsigned capacity) {
    MinHeap* minHeap = (MinHeap*)malloc(sizeof(MinHeap));
    minHeap->size = 0;
    minHeap->capacity = capacity;
    minHeap->array = (MinHeapNode**)malloc(minHeap->capacity * sizeof(MinHeapNode*));
    return minHeap;
}

// 交换两个结点
void swapMinHeapNodes(MinHeapNode** a, MinHeapNode** b) {
    MinHeapNode* t = *a;
    *a = *b;
    *b = t;
}

// 最小堆调整
void minHeapify(MinHeap* minHeap, int idx) {
    int smallest = idx;
    int left = 2 * idx + 1;
    int right = 2 * idx + 2;

    if (left < minHeap->size && minHeap->array[left]->freq < minHeap->array[smallest]->freq)
        smallest = left;

    if (right < minHeap->size && minHeap->array[right]->freq < minHeap->array[smallest]->freq)
        smallest = right;

    if (smallest != idx) {
        swapMinHeapNodes(&minHeap->array[smallest], &minHeap->array[idx]);
        minHeapify(minHeap, smallest);
    }
}

// 获取最小结点
MinHeapNode* extractMin(MinHeap* minHeap) {
    MinHeapNode* temp = minHeap->array[0];
    minHeap->array[0] = minHeap->array[minHeap->size - 1];
    --minHeap->size;
    minHeapify(minHeap, 0);
    return temp;
}

// 插入结点
void insertMinHeap(MinHeap* minHeap, MinHeapNode* minHeapNode) {
    ++minHeap->size;
    int i = minHeap->size - 1;
    while (i && minHeapNode->freq < minHeap->array[(i - 1) / 2]->freq) {
        minHeap->array[i] = minHeap->array[(i - 1) / 2];
        i = (i - 1) / 2;
    }
    minHeap->array[i] = minHeapNode;
}

// 创建和构建最小堆
MinHeap* buildMinHeap(char data[], int freq[], int size) {
    MinHeap* minHeap = createMinHeap(size);
    for (int i = 0; i < size; ++i)
        minHeap->array[i] = newNode(data[i], freq[i]);
    minHeap->size = size;
    
    for (int i = size / 2 - 1; i >= 0; --i)
        minHeapify(minHeap, i);
    
    return minHeap;
}

// 检查结点是否是叶子结点
int isLeaf(MinHeapNode* root) {
    return !(root->left) && !(root->right);
}

// 构建霍夫曼树
MinHeapNode* buildHuffmanTree(char data[], int freq[], int size) {
    MinHeapNode *left, *right, *top;
    MinHeap* minHeap = buildMinHeap(data, freq, size);

    while (minHeap->size != 1) {
        left = extractMin(minHeap);
        right = extractMin(minHeap);
        top = newNode('$', left->freq + right->freq);
        top->left = left;
        top->right = right;
        insertMinHeap(minHeap, top);
    }

    return extractMin(minHeap);
}

// 打印霍夫曼编码
void printCodes(MinHeapNode* root, int arr[], int top) {
    if (root->left) {
        arr[top] = 0;
        printCodes(root->left, arr, top + 1);
    }

    if (root->right) {
        arr[top] = 1;
        printCodes(root->right, arr, top + 1);
    }

    if (isLeaf(root)) {
        printf("%c: ", root->data);
        for (int i = 0; i < top; ++i)
            printf("%d", arr[i]);
        printf("\n");
    }
}

// 压缩数据
void huffmanCompression(char data[]) {
    int freq[256] = {0};
    int n = strlen(data);
    for (int i = 0; i < n; ++i)
        ++freq[data[i]];

    char arr[256];
    int freq2[256];
    int size = 0;
    
    for (int i = 0; i < 256; ++i) {
        if (freq[i] != 0) {
            arr[size] = (char)i;
            freq2[size] = freq[i];
            ++size;
        }
    }

    MinHeapNode* root = buildHuffmanTree(arr, freq2, size);
    int arr2[MAX_TREE_HT], top = 0;
    printCodes(root, arr2, top);
}

int main() {
    char data[] = "hello world";
    huffmanCompression(data);
    
    return 0;
}

这个示例代码演示了使用Huffman算法对输入的数据进行压缩,并打印出各个字符的Huffman编码。huffmanCompression 函数首先统计输入数据中每个字符的出现频率,并构建Huffman树,然后通过递归遍历Huffman树获取每个字符的Huffman编码并打印出来。在 main 函数中,我们对一个简单的字符串进行了压缩,并输出了每个字符的Huffman编码。

需要注意的是,这个示例代码仅演示了Huffman算法的基本压缩原理,实际应用中可能需要对数据内容、编码方式等进行更多处理和优化。

4 C语言Huffman解压缩算法示例

以下是一个简单的C语言示例代码,实现了Huffman算法进行数据解压缩的功能:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

// 结点结构体
typedef struct MinHeapNode {
    char data;
    struct MinHeapNode *left, *right;
} MinHeapNode;

// 解压缩数据
void huffmanDecompression(char data[], MinHeapNode* root) {
    int n = strlen(data);
    MinHeapNode* current = root;
    
    for (int i = 0; i < n; ++i) {
        if (data[i] == '0') {
            current = current->left;
        } else {
            current = current->right;
        }

        if (current->left == NULL && current->right == NULL) {
            printf("%c", current->data);
            current = root;
        }
    }
}

int main() {
    // 构造Huffman树
    MinHeapNode *root = (MinHeapNode*)malloc(sizeof(MinHeapNode));
    root->left = root->right = NULL;

    MinHeapNode *A = (MinHeapNode*)malloc(sizeof(MinHeapNode));
    A->data = 'A';
    A->left = A->right = NULL;

    MinHeapNode *B = (MinHeapNode*)malloc(sizeof(MinHeapNode));
    B->data = 'B';
    B->left = B->right = NULL;

    MinHeapNode *C = (MinHeapNode*)malloc(sizeof(MinHeapNode));
    C->data = 'C';
    C->left = C->right = NULL;

    root->left = A;
    root->right = B;
    A->left = C;
    A->right = NULL;
    B->left = B->right = NULL;
    C->left = C->right = NULL;

    // 待解压缩的数据
    char data[] = "00100110001";

    // 解压缩数据
    huffmanDecompression(data, root);
    
    return 0;
}

在这个简单的示例代码中,我们首先构建了一个简单的Huffman树,然后定义了一个待解压缩的数据字符串。huffmanDecompression 函数接受压缩后的数据和Huffman树的根结点作为参数,通过逐位解析压缩后的数据,按照Huffman树逐步走到叶子结点,从而解压缩出原始数据并打印。

在 main 函数中,我们构造了一个简单的Huffman树,并指定了一个简单的待解压缩的数据字符串,然后调用 huffmanDecompression 函数进行解压缩操作。解压缩过程中,输出的字符序列应该是根据Huffman树进行解码后的原始数据。

需要注意的是,这个示例代码中的Huffman树和待解压缩的数据都是固定的,实际应用中可能需要根据具体的压缩数据和Huffman树结构进行相应的解压缩处理。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 FPGA开源工作室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
算法篇_RGB图像数据压缩与解压(单片机使用)
在当今物联网(IoT)技术快速发展的背景下,嵌入式系统在各种应用场景中扮演着越来越重要的角色。随着物联网设备数量的不断增长,数据传输成为了关键的一环,尤其是在资源受限的环境中,如何高效地传输数据变得尤为重要。本文将介绍一个基于STM32F103ZET6微控制器的图像采集系统,该系统利用OV7725摄像头采集RGB565格式的图像,并通过MQTT协议将图像数据上传至阿里云物联网平台。 但是原始RGB565图像数据量巨大,直接传输会带来较高的网络负载,需要设计有效的压缩算法来减小数据体积。
DS小龙哥
2025/05/27
1340
算法篇_RGB图像数据压缩与解压(单片机使用)
算法系列之数据结构-Huffman树
在数据压缩领域,Huffman编码是一种经典的无损压缩算法,而Huffman树则是实现这种编码的关键数据结构。它以其高效性和简洁性被广泛应用于各种场景,从文件压缩到通信协议,都离不开Huffman树的身影。本文将深入探讨Huffman树的原理、构建过程以及其Java如何实现Huffman树。
修己xj
2025/03/12
1500
算法系列之数据结构-Huffman树
霍夫曼压缩算法
霍夫曼压缩算法 概述 霍夫曼压缩算法的主要思想是用较少的比特表示出现频率较高的字符,用较多的比特表示出现频率较低的字符。如下图所示, 实现 ①读入完整的输入流,并转化为字符数组。 ②计算每个字符
felix
2018/06/08
1.8K0
数据结构和算法——Huffman树和Huffman编码
Huffman树是一种特殊结构的二叉树,由Huffman树设计的二进制前缀编码,也称为Huffman编码在通信领域有着广泛的应用。在word2vec模型中,在构建层次Softmax的过程中,也使用到了
felixzhao
2018/03/14
1.1K0
数据结构和算法——Huffman树和Huffman编码
讲解Cause: invalid code lengths set
当我们在处理数据压缩或者解压缩的过程中,有时会遇到一个错误消息:"Cause: invalid code lengths set"。这个错误通常与Huffman编码相关,表示我们在使用Huffman编码进行数据解码时遇到问题。
大盘鸡拌面
2023/12/21
3400
哈夫曼实现文件压缩解压缩(c语言)
在计算机数据处理中,霍夫曼编码使用变长编码表对源符号(如文件中的一个字母)进行编码,其中变长编码表是通过一种评估来源符号出现机率的方法得到的,出现机率高的字母使用较短的编码,反之出现机率低的则使用较长的编码,这便使编码之后的字符串的平均长度、期望值降低,从而达到无损压缩数据的目的。
全栈程序员站长
2022/08/10
2.6K0
哈夫曼实现文件压缩解压缩(c语言)
VBA解压缩ZIP文件02——压缩过程
要实现解压缩肯定得了解压缩的过程,解压缩相比压缩来说是简单很多,简单说一下压缩的过程。
xyj
2020/07/28
2.4K0
VBA解压缩ZIP文件02——压缩过程
VBA解压缩ZIP文件10——解压-动态Huffman
使用动态Huffman压缩的数据块,在数据块的开头仍然是3个bit的Header,第2个bit是0、第3个bit是1,因为读取过程是先读取低位,再读取高位,所以结果应该是二进制10。
xyj
2020/08/04
8430
gzip压缩算法
gzip,zlib,以及图形格式png,使用的是同一个压缩算法deflate。我们通过对gzip源码的分析来对deflate压缩算法做一个详细的说明:
黄规速
2022/04/14
2.4K0
Python 算法基础篇:堆和优先队列的实现与应用
堆和优先队列是常用的数据结构,它们在算法和程序设计中有着广泛的应用。本篇博客将重点介绍堆和优先队列的原理、实现以及它们在不同场景下的应用。我们将使用 Python 来演示堆和优先队列的实现,并通过实例展示每一行代码的运行过程。
小蓝枣
2023/07/25
5030
实践和项目:解决实际问题时,选择合适的数据结构和算法
在计算机科学中,数据结构和算法是两个非常重要的概念。数据结构是用来存储和组织数据的方式,而算法则是解决特定问题的步骤和操作。在实际应用中,选择合适的数据结构和算法对于提高程序的效率和解决实际问题的能力至关重要。
IT_陈寒
2023/12/13
3830
实践和项目:解决实际问题时,选择合适的数据结构和算法
C 实现 哈夫曼编码
哈夫曼编码是一种用于数据压缩的无损熵编码,根据压缩数据符号出现频率大小进行编码, 出现频率越高,编码后占bit 越少的变长编码。(其他详细介绍见参考)
orientlu
2018/09/13
8820
C 实现 哈夫曼编码
深入理解Huffman编码:原理、代码示例与应用
在这个数字时代,数据的有效压缩和传输变得至关重要。Huffman编码是一种经典的数据压缩算法,它通过将常见字符映射到短编码来降低数据大小,从而节省存储空间和带宽。本篇博客将深入介绍Huffman编码的原理、代码示例以及实际应用。
命运之光
2024/03/20
1.1K0
深入理解Huffman编码:原理、代码示例与应用
【数据结构——树】哈夫曼树(头歌实践教学平台习题) 【合集】
为了能够在构建哈夫曼树时方便地找到权重最小的节点,通常使用优先队列(priority_queue)。需要定义一个比较函数,使得优先队列可以根据节点权重进行排序。
Rossy Yan
2024/12/24
2720
【数据结构——树】哈夫曼树(头歌实践教学平台习题) 【合集】
C++实现哈夫曼编码压缩软件
一个简单的压缩软件,利用哈夫曼思想,构造哈夫曼编码,实现对文件的二进制压缩,以及解压,再利用MFC制作可视化操作界面,美化软件又简化文件操作。(各个步骤有解释可看)
HcodeBlogger
2020/07/14
2.3K0
C++实现哈夫曼编码压缩软件
c++ 哈夫曼树简便构造(数据结构作业篇)
    MinHeapNode(char data, unsigned freq)
星辉
2019/01/15
1.5K0
VBA解压缩ZIP文件05——Huffman树
ZIP压缩使用的最重要的一个数据结构应该就是这个Huffman树,在压缩过程的介绍中,提到了h1(编码literal和length)、h2(编码distance)、h3(编码SQ1和SQ2)3颗Huffman,另外还有一颗静态的Huffman树(编码literal和length),一共是4颗。
xyj
2020/07/28
1.2K0
VBA解压缩ZIP文件05——Huffman树
哈夫曼树(Huffman Code)
给定n个权值作为n个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,则称之为最优二叉树,也就是哈夫曼树。
None_Ling
2019/05/31
7260
贪心算法(Greedy Algorithm)之霍夫曼编码
在上面图中再加入些区间数据[2,3];[-1,4],[5,12];[4,5],代码实现如下:
Michael阿明
2021/02/20
5400
贪心算法(Greedy Algorithm)之霍夫曼编码
哈夫曼编码和数据压缩Java
第二步:创建新的HFMTreeNode, 在优先队列里面添加每一个Huffman Node
成都小展
2020/07/14
5540
相关推荐
算法篇_RGB图像数据压缩与解压(单片机使用)
更多 >
LV.0
这个人很懒,什么都没有留下~
作者相关精选
交个朋友
加入腾讯云官网粉丝站
蹲全网底价单品 享第一手活动信息
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验