基于INTERNET网页的流行词语判定属性研究

来源 :第三届HNC与语言学研究学术研讨会 | 被引量 : 0次 | 上传用户:ryu_sh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以2005年的1月1日至6月25日新浪网上下载的各类页面上的文本内容为研究资源集合,从中提取出有效词语,对词语的流行程度的判定属性做了定性定量的分析研究,对词语的流行特性进行了定义,在此基础上,引入衡量关注程度的量化方法,并配合依据词语判定属性与时间关系而绘制的走势曲线图,设置淘汰机制与评分机制,得到了候选流行词语,验证了流行词语判定属性规范的合理性,为机器辅助判定词语特性提供了参考数据。
其他文献
“NP1+有+NP2”是一个多义格式,每一种意义都有其特定的搭配和使用条件。本文继承冯志伟先生中文多叉多标记模型理论和潜在歧义理论思想,阐述“有”构成的“NP1+有+NP2”型下位
以南海石化项目为例,针对国内承包商在国际总承包工程项目的投标报价过程中出现的问题进行探讨; 提出作为承包商在投标报价时应注意的关键点和具体的操作方式.“,”TAKING NA
本文借鉴国内“格语法”研究的成果,按照主语语义格的不同将“被”字句分成了11类。通过对这11类“被”字句进行考察分析,发现“被”字句和常式句、“把”字句存在着不对称性,而
语义块构成分析是句类分析三部曲中的重要一环,直接涉及语句局部联想脉络的生成,同时对句类分析的成败也具有重大影响。池毓焕的博士论文对显含串并联标记符(14型概念)的这一类
会议
动宾式动词一般不带宾语,但近年来出现了大量的动宾武动词带宾语的语言现象。本文以HNC理论为新视角,对这一句法现象进行考察分析,描写了动宾武动词的词汇演变轨迹,分析了该类动
本文基于已有的HNC标注语料,考察辅语义块的结构特征,通过统计分析,明确辅语义块在句子中的分布及七类辅语义块在不同句类中所占的比例,常用介词在辅语义块类别中的分布,并指出辅
语段是以句号、问号和叹号分隔的文本片段。语段处理以语串处理为基础,语串则是语段内部用逗号或分号分隔的文字串。被逗号分隔的语串可以是句子、语义块、语习概念、句间逻辑
会议
特征语义块和述语动词都具有非常重要的地位,在形式上也有相似之处。本文从内涵和形式两个方面对特征语义块和述语动词进行审视和分析,重点比较它们之间的区别得出了特征语义块
本文主要归纳分析了u*n*n组合的各种出现情况,重点研究了多元逻辑组合内部u*n*n格式歧义结构的语义构成,统计得到了u*n*n格式歧义结构各子类的分布情况,并以此为基础探讨了u*n*n
“需要”句是指形式如“A+需要+B”并且“需要”不为r概念的句子,其中的A、B只是表示“需要”前后的部分,并不一定是JK1和JK2。对“需要”句的句类分析存在一些疑难:如何确定“