【摘 要】
:
复句是汉语语法的重要实体单位,关系词的自动识别是复句标识的基础,对复句的标识以及篇章的研究有重要意义。在对汉语复句语料库进行广泛分析的基础上,从复句关系词所在的环
【基金项目】
:
教育部社科基金(13YJAZH117), 国家社科基金(14BYY093)资助
论文部分内容阅读
复句是汉语语法的重要实体单位,关系词的自动识别是复句标识的基础,对复句的标识以及篇章的研究有重要意义。在对汉语复句语料库进行广泛分析的基础上,从复句关系词所在的环境和关系词的组合搭配方面进行特征的提取,对提取的特征进行形式化描述。采用互信息和信息增益相结合的方式进行特征选择以及冗余特征的消除;使用贝叶斯模型对特征集合进行训练和测试;将基于统计过程的结果转化为规则,形成规则库,并根据规则进行关系词自动识别。实验结果显示,本方法获得了较高的识别正确率,具有可行性和有效性。
其他文献
降低模型的复杂度在业务流程管理(BPM)领域是一个关键的问题.面向方面的业务流程建模主张从主流程中分离出不同的关注点,并单独建模,然后通过一定的编织机制组合方面与主流程.
领域适应学习旨在利用源领域中带标签的样本来解决目标领域的学习问题,其关键在于如何最大化地减小领域间的分布差异,有效解决领域间数据分布的变化.对当前领域适应学习算法
实际应用中获取到的数据集通常是动态增加的,且随着数据获取工具的迅速发展,新数据通常会一组一组地增加。为此,针对含有缺失数据的动态数据集,基于粗糙集理论,提出了一种组
提出了一种云端信息安全字形的生成模型。该模型将汉字的字形抽象为汉字结构模式和汉字的风格模式,然后通过定义有效的汉字结构输出和汉字笔画生成方案,动态地生成了可用于信
结合Logistic映射和三维离散Lorenz映射,构造了一个新的五维离散混沌映射。基于该映射,提出了一个只有两轮扩散操作的图像加密算法,在第一轮扩散操作中的密钥流与明文相关,在
定位与无线装置在公交系统中的广泛应用使得获取实时公交数据成为可能。为挖掘这些数据中蕴含的道路交通状况信息,提出了一种基于K-means聚类算法的数据融合模型,来计算相邻
精神疲劳识别中普遍存在着方法的侵扰性、实时性与识别准确率之间相矛盾的问题。为此,引入可拓理论和方法来建立问题的可拓模型,针对矛盾主体建立关联函数和策略优度函数。结合领域知识,通过拓展分析、可拓变换对矛盾进行转化,生成多种同时满足非侵扰性、实时性和识别准确率的特征和识别策略,并对策略优度进行计算和分析。实验研究验证了本方法的有效性。本研究为计算机模拟人类思维进行算法研究和创新奠定了基础。
描述了一个汽车电子嵌入式实时操作系统的分层形式模型:在低层,该操作系统的顺序内核承担基础设施的角色,实施任务、ISR和系统服务等并发执行体之间的切换;而在高层,该操作系
大多数经典活动轮廓模型只具有某些方面的优势,不能同时满足处理复杂图像的要求,对此提出一种具有多重分割特性的分割模型。模型通过引入差分图像,将差分图像的BGFRLS模型作为全局控制项,以保证模型能够最大限度地检测到所有的目标边缘;其次,将长度项设为局部项,使得分割进一步精确化,并将Li方法中的惩罚项加入到模型中,避免了重新初始化水平集函数,提高了分割效率;最后,模型在全局控制项和局部控制项之间引入了
利用有监督的机器学习的方法来对中文产品评论文本进行情感分类,该方法结合了word2vec和SVMperf两种工具。先由word2vec训练出语料中每个词语的词向量,通过计算相互之间的余