融合句法信息的文本语料库检索方法研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:Cyril
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]探究高效的大规模文本语料库句法信息检索方法。 [方法]依据句法信息特点,将句法信息线性化索引,直接提供检索时条件匹配所需的各种信息,从而提升检索速度。 [结果]使用2851万句《人民日报》语料进行实验,26个检索条件平均用时802.6毫秒,达到了大规模语料库检索系统对检索效率的要求。 [局限]实验使用的检索条件数量较少,未使用更多的检索条件进行验证。 [结论]本文方法有助于在大规模文本语料库中快速地检索词法信息、依存句法信息和成分句法信息。
其他文献
本文选题源于笔者跟随导师进行的城市设计实践中,将“山水意象”运用于城市设计,关注城市公共中心的空间特色建构和城市文化的传承与发展,认识到“山水意象”对塑造自然与人工相和谐、文化与场所相融合的城市公共中心具有重要的指导与实践意义。同时结合当下塑造城市特色风貌与弘扬优秀传统文化融入城市设计的研究命题,并基于实践反观时下具有“山水”特质的城市公共中心设计,在实践与理论上缺少基于城市设计的地段空间“山水意
近年来深度神经网络在图像分类、目标检测与实例分割等方面取得了重大进展。训练深度神经网络需要大量的训练数据,对人力标注提出了巨大的挑战。有些领域的图像标注匮乏,例如生物细胞图像,生物学家希望采用较少的人力完成细胞标注。半自动标注方法即采用深度学习技术对图像进行预测并由标注人员进行少量修改,是提升标注效率的有效手段,对于加快生物学家的实验流程具有重要意义。本文以细胞图像实例分割任务为例,以减少人力标注
学位
学位
四川省泸州市的传统支柱产业为白酒产业,泸州老窖、郎酒等品牌驰名中外。目前,在第十五届中国国际酒业博览会,泸州成为中国第一个夺得“世界级白酒产业集群”称号的城市。员工的综合素质是白酒企业获得可持续竞争优势的关键环节,而将人力资源转化为人才优势的一个有效途径就是员工培训。培训不仅能提高员工的各种能力,还可以提高企业的绩效,最终实现双赢局面。目前企业所组织的培训往往并没有收到好的培训效果,要想从根本上解
学位
夏季西太平洋副热带高压脊线(以下简称西太副高脊线)南北位置是决定中国东部雨带移动的重要大气环流指数。目前,传统统计方法和数值模式方法对六月西太副高脊线指数提前三个月的预测技能还不理想(相关系数小于0.5)。近年来,已有一些研究表明利用机器学习方法可以显著提升气候预测技能。因此,本论文研究如何利用机器学习方法预测西太副高脊线、提升提前一个季度预测六月西太副高脊线的预测技能。不同于其它“大数据”领域,
学位
目的评价新辅助免疫治疗联合化疗在可切除局部晚期鳞状细胞肺癌中的安全性和有效性。方法收集吉林大学第二医院胸外科在2019年9月至2022年2月收治的行新辅助治疗的鳞状细胞肺癌患者的电子病例,根据是否使用免疫治疗分为两组。观察组中的21例患者使用程序性细胞死亡受体1抑制剂(卡瑞利珠单抗)联合紫杉醇+奈达铂为新辅助治疗方案,在该组中共19例男性患者,2例女性患者,中位年龄为59(55-66.5)岁。对照
学位