论文部分内容阅读
针对汉语短报文的词组与频度特征,本文提出了一种两层的编码压缩技术框架,其核心为基于末位识别的变长编码方法,该方法在有效地实现短报文长度缩减的同时,不会破坏编码后的二进制流中的字符频度,从而使其易于采用短报文压缩领域的相关研究成果进行二次压缩。最后,给出模型的基本实现方法和进一步工作的内容。