基于相对频次的标签相关性判断优化研究

来源 :第五届全国情报学博士生学术论坛暨2015中国信息资源管理论坛 | 被引量 : 0次 | 上传用户:fanjing0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以标签与认知的基本关系为基础,提出了一种基于相对频次的改进策略,在标签预处理的基础上,计算每一个标签的相对频次,并将其最高数值赋为1,进而对其他结果进行归一化处理;之后,根据预先设定的阈值筛选出相关标签集合。并以社会化标注社区“豆瓣电影”的675351位用户的标签数据为例进行实验,以验证策略的效果.结果显示,该策略使得标签相关性判断的效果得到了显著改善.其中,对于频次不小于5的标签,策略的召回率大幅提升,由79.63%升至89.36%;准确率虽有略微下滑,由93.33%降至92.02%,但仍保持在较高水平.
其他文献
随着经济全球化发展的需要,教育也必须走向国际化.体育作为一种非常重要的国际理解教育资源,在教育国际化的进程中承担着重要的作用.本文从"为什么"、"是什么"、"怎么做"三个方面着手,阐述了在初中体育学科中渗透国际理解教育的必要性,以及初中体育国际理解教育渗透课程的目标、内容,并结合教学实际,用案例说明如何在初中体育课中渗透国际理解教育.通过在初中体育与健康课中渗透国际理解教育,不仅要让学生拓宽体育文
本文主要介绍了哈尔滨市中小学实施国家"体育、艺术2+1项目"的全过程,并对这一过程中的重点研究内容做了阐述,以深化体育、艺术课程教学改革为核心,以课堂教学为主渠道,以课外活动为补充,以学生自主活动、创新活动和能力锻炼为基本切入点,做到了学科课程与“2+1项目”的结合。以科研为先导,制定严谨的实施方案;实施项目目标,启动推进方案的落实,开发学生的艺体专业能力,满足学生个性发展的需要。学校充分开发冰雪
为了提高体育教学中心理健康教育的有效性,更好地地促进学生良好心理的形成,笔者对小学生普遍存在的任性、自私、缺乏自信与合作等问题进行了调查研究.研究目的是在体育教学活动中渗透心理健康教育,培养学生热爱集体、关心同伴、团结协作等心理品质,提高心理健康的意识和能力,奠定做人的基础.教师精心创设亲、助、乐的人际情境;通过互动式教学,培养学生自信心、创造性和合作精神;塑造健康的心理品质.较好地实施了小学体育
本课题针对小学学校运动会的现状,通过对学校运动会改革的设计和实验,结合我区的地方特色和实际情况,对"不同模式校运会"改革进行多方位的实践研究.三年来,对"农村"、"城市"和"城乡结合部"三类学校进行实验和跟踪研究.实验改变了以往学校运动会只有少数人参与、大多数人做观众的现象,改进了学校运动会的组织模式、管理办法、比赛规则、裁判法、项目设置等,基本形成了现代学校运动会融民族性、区域性、全体性、竞争性
本文基于社会网络分析理论,以新浪微博为数据源,以4,919条“埃博拉”话题微博为原始信息源,采用Java编程方式接入微博API开放平台获取数据,使用Gephi等舆情分析工具对14,735条埃博拉舆情信息数据进行实证研究.对移动端和非移动端埃博拉舆情信息传播进行了对比分析,分析结果揭示了移动环境下网络舆情信息传播特点,验证了社会网络分析法在移动环境下网络舆情信息传播研究中的有效性.本文为移动环境下网
本文介绍了社交网站这种新媒体发展的现状,界定了社交用户流失的概念及其行为分类.从流失行为的相关研究内容、流失行为研究的理论基础及流失行为的影响因素三个方面对用户流失行为研究进行了相关综述, 从用户个体行为、正在使用的系统(在用系统)及将要转移去的系统(转移系统)三个维度对要素进行划分。可以看出,用户和正在使用的系统产品或服务之间构成人-服务/产品的内部影响;用户与即将打算转移去的系统产品或服务之间
本文基于信息生态视角,从“信息人、信息、信息技术、信息环境”四个信息生态要素和谐发展的角度,针对数字图书馆微服务的特点,构建了数字图书馆网站微服务评价指标。运用层次分析法确定了指标权重并对评价指标进行了准确性和可靠性检验。在应用层面,运用实证分析方法,选择国内外具有代表性的10个数字图书馆作为样本,对所构建的指标体系进行验证和分析。实证结果表明,指标体系具有实际应用价值和较强的可操作性,能更好的指
为改变现有馆藏数字资源不同聚合方法单一维度发挥作用的现状,促进数字源资不同聚合方法的多维度融合,形成数字资源不同聚合方法的合力,实现对数字资源的知识组织、知识挖掘和知识发现,切实为用户提供深度的个性化服务.在对现有数字资源不同聚合方法融合的研究的现状进行梳理的基础上,充分考虑数字资源多维度聚合方法融合的内外环境及客观条件的制约,提出了数字资源多维度聚合方法融合的机理、多阶度融合的理论体系框架.通过
由于知识具有与自然界中生物体类似的特征和属性,知识在科学文献传播网络的演变过程中体现出了与生物体进化相似的特点。从进化机理上分析,知识的进化一方面在于信息与知识的重新组合,变异性的知识结构使创新知识以科学文献的方式体现,同时,知识的进化也包含着先进知识的传承,知识的变异、遗传和环境适应性共同构成了知识的进化特征。正是由于科学文献承载的知识处于不断进化之中,从而促使了科学文献传播要素构成的网络也处于
本文通过可比语料聚类实验以比较三种不同的文本表示方法,分别是空间向量模型(VSM),潜在语义索引(LSI),深度学习(DL).将可比语料中的源语言文本翻译为目标语言文本,然后和可比语料中的目标语言文本归为一个文本集合中.分别利用VSM,LSI和DL,三种方法来表示文本并进行聚类.实验结果显示:根据聚类得到测评数据中净相似度与可识别的类簇数量,用深度学习表示文本的方法比其他的几种表示方法聚类效果要好