论文部分内容阅读
信源压缩是一项重要的信息处理任务,其技术手段的发展依赖于完整的信源压缩理论。Shannon信源编码定理和网络信息理论关于相关信源编码的内容,在其证明过程中大多采用随机序列编码并允许任意小的错误概率存在。然而,出于许多原因,让我们去考虑无错误的信息压缩理论。在某些实际应用中,比如压缩存储一家银行的数据,任何错误都是不能容忍的。另一方面,现实中很多时候并不总是能获得足够多的信源消息使得编码器可以采用序列编码。本文考虑无错误的信源压缩理论,即不允许接收端有任何的译码错误。对于一个单信源,Kraft不等式是判别对于给定的码长集合,前缀码存在的充分必要条件。本文尝试将其推广到两相关信源时的情形。指出当|x|=|y|=2,3时,如果给定码长矩阵的每一行和每一列都能满足Kraft不等式,那么必然有一个编码,使得每一行每一列都是无前缀的。随后证明了当|x|=|y|=4时,上述条件不是充分的。但是只要对码长矩阵稍作限制,仍然是一个充分条件。当|x|=|y|=5时,文章中给出了可以使得全部行和列都能使Kraft不等式取等号的码长矩阵所有形式的代表。对于最一般的情形,根据前人的结果,文中指出Kraft不等式的推广是一个极其困难的问题。Sardinas-Patterson检验程序,可以用来判断信源码是否是唯一可译的。它在两维情况下的推广已由前人获得,考虑文章的完整性,本文对此作了介绍。其次,对于两个用户通过中继节点采用变长码压缩以后,交换信息的场景,本文考虑了在两端都能无错译码的前提下,中继处能获得的最大压缩程度。先是给出了可以使得两端同时达到最优速率,即两个条件熵H(X/Y)和H(Y/X)的拉丁方形式的概率分布,这是目前已知的可以达到两端同时最优的唯一的概率分布形式。接下来,本文给出了处理一般情况的图染色方案,定义了染色熵Hφ(X,Y)。最后,考虑到若是中继处采用Huffman编码,那么X和Y两端同时达到最优意味着两个不同的概率分布对应同一个Huffman编码码字集,为此本文研究了Huffman编码码字集形式对于概率分布的不连续特性。另外,对于一个概率分布,我们还考虑了若是它的每一个分量均可能受到很小的干扰的情况下,是否还能够保持最优码形式的问题,并且以1-范数的形式给出了摄动小量ε的变化范围。最后,对于概率分布为的编码最优的概率分布,然后考虑与这个概率分布具有相同Huffman编码形式的可能的概率分布p’,指出公比q的范围介于或者的等比数列形式的概率分布满足条件,并发现斐波那契数列的Huffman码与其相同。