基于改进线图分析算法的浅层汉语句法分析器的设计与实现

来源 :计算机应用研究 | 被引量 : 11次 | 上传用户:xiaoxunjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的汉语句法分析算法进行改进,采用了自底向上与自顶向下相结合的线图分析方法,分析、设计和实现了一个汉语句法分析原型系统。该系统实现了基于最大词长匹配算法的分词模块、基于统计方法的词性标注模块和基于改进的线图分析算法的句法分析模块。最后对系统进行小规模中文文本试验测试,测试结果表明利用改进的分析算法,使得句法分析效率和分析结果的准确率均有一定程度的提高。
其他文献
提出RRMF算法,用向前纠错和重传技术相结合的方式为网络提供可靠组播。FEC通过增加冗余信息的方式提高可靠性。当接收到的信息不足以恢复原始数据时,使用ARQ进行差错恢复。减少了重传发生的次数,从而降低了差错反馈信息和重传数据占用的带宽,适合在大规模交互中使用。
针对多重数字水印的实际应用,结合密码学中的安全双方计算协议和零知识证明协议提出一种动态多重数字水印设计方案。解决了多个作者无规律进入数字产品设计时联合水印的生成问题,并有效地保护了每位作者的身份信息,从而提高多重数字水印在实际应用中的安全性和实用性。
分析了当前主流Ad hoc网络入侵检测体系结构,给出了一种新的划分簇的策略和簇头选择方法。分析和实验表明该方法可以减少簇头节点的数量,延长网络的生存时间。
针对目前广泛使用的固态优先级RMS调度策略,利用时间需求分析算法对系统中所有周期任务进行可调度性分析测试,保证其在临界点仍可以满足时限。利用排队论中的M/M/1/K排队系统,根据非周期事件接收缓冲和可延期服务器定量分析非周期事件的平均响应时间和系统异步事件丢失率,使之符合系统要求。
由于集群节点通常只有局部IP地址,集群通过主节点对外通信,无法满足工程应用和科学计算的要求;另外在网格应用中,常见的集群资源监控组件提供的信息量和信息种类还不够满足应用需求。为此提出并实现了扩展Globus MDS的解决方案。在曙光集群上的测试以及在面向多学科应用的模拟与可视化网格环境(MASSIVE)中的应用证明了该解决方案是可行的。
结合MySQL数据库系统,通过在其源代码中增加安全策略函数、修改原有数据字典、扩展SQL语句以及建立安全策略统一管理平台的方法,实现了可定制强制访问控制机制。所实现的安全数据库原型系统使数据库安全管理员可以根据应用领域不同的安全需求灵活定义标签结构和访问规则,为增强安全数据库产品可用性、灵活性提供了一种新思路。
针对嵌入式系统中大容量存储设备及其管理方面的需求,分析了传统的固定单元管理方式的弊端,提出了一种针对大容量Flash存储系统的灵活的管理方案。该方案通过实际访问量来动态地管理Flash,提高了操作效率,同时也减少了资源占用,保证了系统的性能。
提出一种基于位平面分解技术的JPEG压缩水印算法。该算法首先对图像进行置乱变换;然后采用位平面分解技术对灰度水印图像进行预处理操作,将该灰度水印图像转换成二值信息流;最后把水印嵌入载体图像中。实验表明,该算法对于不同类型的攻击有较强的鲁棒性。
从样本的类空间分布和随机测试样本对每个类别的隶属度两方面考虑,对现有的分离测度进行了改进,并给出了一种基于隶属度分离测度的SVM决策树多类分类算法。实验表明,对于随机测试样本属于每个类别的概率均不相同的多类分类问题,基于隶属度分离测度的SVM决策树在与传统的SVM决策树有着基本相同的分类精度情况下,具有更快的分类速度。
对传统的完整性模型进行了分析,并对其完整性给予形式化描述。在此基础上,提出了轻量级的Clark-Wilson模型,并给出了其在安全增强操作系统SELinux中的实施。