【摘 要】
:
[目的]在文献层和词汇层之间加入主题层,研究一种新的词汇相似度计算方法.[方法]阐述基于形式概念分析(FCA)的主题定义和表示模型,将词汇项映射到主题层级,提出一种基于主题
【机 构】
:
武汉大学信息管理学院 武汉430072;武汉大学数字图书馆研究所 武汉430072;武汉大学信息管理学院 武汉430072;
论文部分内容阅读
[目的]在文献层和词汇层之间加入主题层,研究一种新的词汇相似度计算方法.[方法]阐述基于形式概念分析(FCA)的主题定义和表示模型,将词汇项映射到主题层级,提出一种基于主题相似度定量刻画词汇相似度的计算方法.[结果]以信息检索领域为例,以SIGIR会议2006-2016年收录的论文数据为样本进行评测,结果表明本文方法的精确率与召回率比FastText方法有显著提高,最大提升幅度分别达到30%和21%.[局限]该方法依赖文献关键特征词抽取的质量.[结论]基于形式概念分析的词汇相似度计算方法有效利用了词汇对应的主题语义关系,能更好地反映词语之间的关联性.
其他文献
[目的]利用用户、标签、图书三者之间的关系实现群组推荐.[方法]通过用户-标签、图书-标签的标注关系,利用K-means算法进行用户聚类和图书聚类,形成用户群组和图书群组,并进
[目的]将同一篇引文文献的不同表达形式进行归一,实现期刊引文数据规范控制与管理,减轻引文失范造成的数据质量问题.[方法]以期刊引文数据库建设为目标场景,根据参考文献著录
[目的]减少文本数据的训练数据量,缩短模型训练时间.[方法]基于协方差估计,提出一种新的过滤式样本选择算法,并将数据的遗忘性研究成果应用到嵌入式样本选择算法中.[结果]在
[目的]理清网络在线信任影响因素,洞察信任者与被信任者需求,发掘内外部环境的影响差异,解释各影响因子的作用效应,精准提升用户信任度.[文献范围]在Web of Science、CNKI等