一种人机结合的文本特征词集生成方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:wzw919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运用复杂系统理论分析了向量空间模型(VSM)法进行大规模文本信息处理过程中自动生成特征词集方法的局限性.指出人机结合、定性定量综合集成的方法才是当前解决特征词集生成问题的根本途径.给出了一种人机结合的文本特征词集生成方法,并进行了实例验证.
其他文献
伴随着移动网络的迅速发展,以微信为代表的自媒体通信工具正急剧影响着人们的工作生活,在大学生群体中,影响更为广泛。微信作为新兴移动网络载体,在满足大学生的个性表达和自主学
传统的搜索引擎都不具备理解文档内容的能力,导致查准率普遍不高.本文提出一种采用RDF和信息提取技术的新的搜索引擎.该引擎采用信息提取技术自动获取和生成网络资源的元数据
科技成果管理与转化是我国科技、经济和社会发展中的重要问题,一直受到政府和社会各界的高度关注。国家中长期科学和技术发展规划纲要已明确指出要加强以企业为主体,以市场为导
我们做任何事情都离不开我们的生活,无论是我们在学校的教育还是自身习得的知识亦或是书本上得出的归纳总结,一切都是以生活为中心进行展开的。我们是现代的人,要进行现代化的生
提到“三低股”,很多投资者可能认为是低市盈率、低市净率、低市销率等低估值个股,想到的是机会,我们这里提到的“三低股”则是低股价、低市值、低换手率的标的,讲的是风险。
本文在对国内外相关研究广泛借鉴的基础上,提出了影响中国地方政府部门间信息共享的三个机构因素:部门规模、部门电子化建设和部门政策,并建立了相应的理论框架和假设。依据调
滤棒长度如何对滤棒压降标准差产生影响,一直是丝束生产企业和滤棒加工企业关注的重点,本文将三个不同压降梯度的滤棒分别切割成不同长度的滤棒,然后把切割出的九组滤棒进行
简称是由语言中比较长的说法通过缩略的方式而形成的简短说法.汉语的简称比英语复杂,有很多问题值得研究.本文探讨了汉语简称的类型、构成原则,着重探讨汉语简称形成的内在机
针对组合优化的旅行商(Travelling salesman problem,TSP)问题,提出了一种基于改进鸟群算法的求解方法。制定了TSP路径编码方案,并利用鸟群的飞行行为、觅食行为和警惕行为实
简要介绍了IR的概念和现状,在此基础上对IR的体系框架、功能及主要技术进行详细的论述,最后分析了IR的发展趋势。