农业古籍断句标点模式研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:kill5678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
农业古籍的整理已经引起了众多学者和专家的注意,但是,对于农业古籍的自动断句、标点模式的研究仍付之阙如。本研究探索并总结出部分农业古籍断句、标点识别模式。首先采用句法特征词断句法、同义语标志词法进行初步断句;进而利用反义复合词、引书标志、时序、数量词、重叠字词、动名结构及比较句法进一步对子句进行断句、标点;最后使用农业用语和禁用模式表进一步提高断句、标点后农业古籍的可读性和准确性。经测试表明,断句、标点的平均准确率分别达到48%和35%,证明本方法具有一定的正确性和可行性。
其他文献
从文档集合的语义结构理解文档集合可以提高多文档摘要的质量。本文通过抽取中文多文档摘要文档集中的主-述-宾三元组结构构建文档语义图,再对语义图中的节点利用编辑距离进
以某炼厂装置布置为案例进行分析,提出将剩余矩形排样算法和遗传算法相结合的新算法,以占地面积(S)最小为目标建立数学模型进行工厂总体布局优化。采用装置固定形状和固定尺
采用氯化胆碱(ChCl)与CuCl加热制备ChCl-CuCl离子液体,并将所制离子液体作为一类高效催化剂用于水相中炔与叠氮的环加成反应得到1,2,3-三唑。实验结果表明,与ChCl-CuCl离子液体
为了研究油脂及其甲酯对杨木粉液化的促进作用,采用大豆油(或甲酯)、杨木粉和甲醇为原料,在高压釜中研究了它们的共炼行为。实验结果表明,甲酯能够显著提高杨木粉在甲醇中的分解率
以配体2,2’-硫代(4,6-二氯苯酚)与不同的钛化合物合成了4种均相非茂金属催化剂,利用1HNMR,MS,13CNMR等方法分析了配体、催化剂以及聚合产物的结构,通过非茂金属催化剂催化乙烯聚合测
本文探索了源语为日语,目标语为蒙古语的动词短语机器翻译系统的实现方式。基于主张日语不活用的派生文法,重新分析日语附加成分。将日语的词干和附加成分转换到蒙古语的词干和
甲骨文信息的数字化需要输入法的支持,已有甲骨文输入法的研究思路还存在可改进之处。从笔画的层面对甲骨文字形进行系统性的笔画分析,提出了一种基于笔画分析的编码方案,并
<正> 本文综述日本近几年来的酱油生产新技术动态,主要有下列各项: 1.利用酱曲高温自溶物生产酱油 为生产质量高、稳定性好的酱油,日本开发了利用酱油高温自治物生产酱油法。
<正> 上海饴糖厂饴糖成品的前蒸发设备一逆流双效降膜蒸发器,是在1980年由市粮食局立项进行模拟试验的基础上扩大设计投产使用的。实践证明其运行参数及其节能效益基本与模拟
提出了一种基于自适应阈值和分形几何的甲骨拓片字形图像复原方法。文章分析了甲骨拓片噪声的特点以及字形图像边缘的分形特征,通过计算自适应阈值对噪声区域进行填充。采用统计的方法计算甲骨拓片字形图像边缘的分形维数特征,对字形图像边缘进行压缩变换,进而对甲骨拓片字形图像边缘进行平滑。实验结果显示,这一方法的图像复原效果是比较明显的。