• 注册
当前位置:1313e > 默认分类 >正文

浅谈哈夫曼编码

做NOIP初赛遇到了,还是填个坑吧


首先,哈夫曼编码是哈夫曼树的应用,不知道什么是哈夫曼树的可以搜一下

具体操作:

(1)我们有一个集合,集合里有一些数,升序排列

(2)每次选出两个最小的数,然后合并,删除,把新生成的数放到集合里

(3)重复步骤2,直到用完所有的数,树也就建好了,然后把左儿子和右儿子定为1和0,两个相反,但只要确定,整棵树都要用同一种编码方式

(4)每个元素的哈夫曼编码就是其路径上的数


这样说可能不太明白,我们还是举个例子

现有一段文言文,要通过二进制哈夫曼编码进行压缩。简单起见,假设这段文言文只由
4 个汉字“之”、“乎”、“者”、“也”组成,它们出现的次数分别为 700、600、300、
400。那么,“也”字的编码长度可能是( )。
A. 1 B. 2 C. 3 D. 4

这是NOIP2011提高组初赛的多选

正确答案是BC

我们只举一个来说,另一个就显而易见了

首先集合里有四个数{300,400,600,700}

先取两个300,400

合并,300+400=700

如图

 

然后放入集合,此时{600,700,700}

取600和我们刚才合并出来的700

然后是700和700

树就建好了

然后是标号:

一一对应,我们得到“也”:111        长度为3

保险起见,我把另一个图画一下:(其实就是把合并的顺序改变一下)

此时  “也”:01    长度为2

这同时也说明了,在集合中有重复的数时,哈夫曼编码不止一种。

希望对大家有帮助

转载于:https://www.cnblogs.com/WWHHTT/p/9763804.html

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 162202241@qq.com 举报,一经查实,本站将立刻删除。

最新评论

欢迎您发表评论:

请登录之后再进行评论

登录