维吾尔文无监督自动切分及无监督特征选择

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:fly8468
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔文常用切分方法会产生大量的语义抽象甚至多义的词特征,因此学习算法难以发现高维数据中隐藏的结构.提出一种无监督切分方法dme-TS和一种无监督特征选择方法UMRMR-UFS.dme-TS从大规模生语料中自动获取单词Bi-gram及上下文语境信息,并将相邻单词间的t-测试差、互信息及双词上下文邻接对熵的线性融合作为一个组合统计量(dme)来评价单词间的结合能力,从而将文本切分成语义具体的独立语言单位的特征集合.UMRMR—UFS用一种综合考虑最大相关度和最小冗余的无监督特征选择标准(UMRMR)来评价每
其他文献
上消化道出血诱发心肌梗塞(AMI)临床上较为少见,有些病历由于AMI症状不典型,临床医生往往把注意力集中在上消化道出血,忽视了AMI的诊断,治疗,该病由于并发症多,死亡率高,值得广大医生
传统的安全防护都是以在边界,通过匹配特征黑名单的方式进行防御,防护手段是被动的,网络状态是不可视的;随着物联网的发展,传统的安全防护思路已经逐渐落后,论文就视频监控网作为物联网的一种,对其特点和安全隐患进行了分析,同时结合业务属性,进行白名单信息防护设计,为视频监控网这个特点场景下提供了安全体系设计的核心思路。
为有效解决冲突证据的组合问题,文中提出一种证据组合方法.该方法首先在一种新的冲突表示的基础上,量化证据之间的关联性,进而计算各个证据的权重,并与平均权重进行比较,识别出冲突
传统结构LPDA的小型化设计一直是研究的热点问题,论文提出了一种基于波状结构实现LPDA小型化处理的方案,通过与传统结构的性能对比以及三位增益方向图分析,验证了该方案的可
根据Markov逻辑网融合一阶谓词逻辑和概率图模型的复杂性及不确定性处理能力的优点,提出将Markov逻辑网和基于本体与WEB搜索的属性抽取算法相结合的命名实体解析方法(MLN_AENER
2005年,学术界继续针对不稳定型冠脉疾病(CAD)患者的首选治疗方案进行激烈讨论。究竟早期介入治疗和保守方法哪种更好?问题固然很重要,因为CAD是导致死亡一个重要原因.而不稳定型心
1资料与方法1.1临床资料我科自2006年10月-12月应用硬膜外麻醉,进行的妇科手术138例,随机分成2个组进行比较,实验组应用自控镇痛,使用自控镇痛62例。对照组76例在手术结束后拔除硬
患者女性,61岁,退休干部。双下肢浮肿1年半,伴胸闷、憋气2月余,加重2周。
患者26岁,孕1产1,因发现下腹部包块7个月,右下腹疼痛7小时,于2002年3月6日人院,患者于妊娠3个月在当地医院B超检查提示,右侧卵巢囊肿,6.0×6.0×5.0cm,嘱其产时或产后手术治疗。
云计算从概念到成熟,经历了较长的时间,闭源的商业云产品已经不能满足企业日益深化的云应用,少量客户的个性化定制,由于无法为闭源厂商提供满意的利益,导致云化改革的举步维