基于排序集成的哈萨克语固定短语抽取

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:baiseshiren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短语抽取是文本自动分类、主题提取及专利检索分析等文本信息理解等工作中都要应用到的一项关键技术。固定短语抽取作为短语研究的一部分,对短语标注、辞典编撰等自然语言处理任务都具有重要的现实意义。哈萨克语是黏着语,词形变化丰富,这些特点给哈语固定短语的抽取带来了一定的困难。提出一个总体的固定短语抽取算法,把固定短语抽取看作一个排序问题,使用C-value、互信息和log-likelihood进行抽取排序,并设计了一个新的排序集成方法对抽取的结果进行集成。实验分析结果表明,与单独的抽取算法比较,该算法达到了更高的准确率。
其他文献
一梦折回何以焉,蟾光无赖扰清眠?半窗影入朦胧境,别样情生寂静天。
火云流尽自清寒,钩月悄声转玉盘。一生不计亏盈事,愿洒清辉山水间。
树影湖光山倒挂,扁舟粉彩映红霞,黄昏西子晚晴美,夕照余晖水绽花。
风催孤棹远,潮足漫滩荒。云影沙鸥白,秋心岸草黄。
倚石巅峰望断江,金湖龙角笑斜阳。枝枯杏小沐霖雨,叶瘦花妖竞艳芳。
俏小摹来恐未真,丹青嘱我倍留神。瞳光笔下轻轻点,雪色毛中淡淡匀。酬祈愿,入凡尘?幽情始掠境前人。蓦然闻似声声杵,照落澄窗恰一轮。
诗词之“深入浅出”乃指其内涵渊宏博大,而行文造句却明白晓畅,浅显如话也。清·俞樾在《湖楼笔谈》中有云:“盖诗人用意之妙,在乎深入显出。人之不深,则有浅易之病;出之不显,则有艰
伟达先生是著名医师,北京伟达中医肿瘤医院院长。悬壶切脉,研制丸药,经常奔走于京闽粤之间。行医之余酷爱风骚,已出版诗词集多种。这本《郑伟达诗词》,
海角热风缓,暮影碧波斜。潮前几只鸥鸟,漫作白云划。记得当时曾伫,梦里随波逐浪,赤脚度年华。回首蓦然见,日落旧金沙。倚窗石,观浩渺,纳流霞。平生多少烦恼,堪把半生赊。水调清音谱尽
闲谈放牧趣情高,一半心思挂草梢。最喜羊逐云朵动,静听蛙鼓几番敲。