基于背景知识和主动学习的文本挖掘技术研究

来源 :计算机应用与软件 | 被引量 : 1次 | 上传用户:liuzujnrui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了达成好的文本分类和文本挖掘效果,往往需要使用大量的标识数据。然而数据标识不但操作复杂,而且成本昂贵。为此,在基于支持向量机的分类技术框架下,在文本分类和文本挖掘中引入未标识数据,具体的执行通过基于背景知识和基于主动学习两种方法展开。实验结果表明,基于背景知识的文本挖掘方法在基线分类器性能较强的情况下可以发挥优秀的文本挖掘性能,而基于主动学习的文本挖掘方法在一般的情况下就可以改善文本挖掘的性能指标。
其他文献
直流电压平衡策略是级联整流器控制中一个重要的组成部分。比例式脉冲补偿平衡策略是一种典型的电压平衡策略,它可以较好地实现特定工况下的直流电压平衡,但是其平衡效果会受到
研究了氯化铁催化合成乙酸异戊酯的工艺条件,在优化条件下,乙酸异戊酯的收率超过95%。优化条件如下,异戊醇0.3mol;乙酸0.36mol;反应时间1h,反应温度145±2℃,氯化铁0.88g,并提出了反应的可能机理。
文章从题材和内容上对初唐七言歌行进行了分析,初唐七言歌行虽摆脱了毫无创新的刻意模仿的阶段,但它尚未能够对以往的题材进行灵活自由的运用,难以达到融他于我而不着痕迹的
用HZSM-5沸石催化剂,在固定床反应器内,对正丁醇与乙酸的酯化反应进行了研究。在正丁醇过量的情况下,对不同催化剂的催化性能和反应条件包括醇/酸摩尔比、反应温度、反应时间
采用N,N-二羟乙基苯胺(BHEA)与丙烯酸直接酯化法,合成了一类可聚合色素的重要中间体。考察了催化剂种类及用量、反应温度、物料配比等反应参数对酯化反应的影响。对酯化产物
以RTWD网工作流模型为基础,提出了循环的形式化定义,包括环形路径、启用点、终止点、启用条件、终止条件、入口、出口等,并基于该定义对循环模式进行了分类。介绍循环状态空间、事件、状态转换图的概念,并举例说明了如何通过循环控制表及状态转换图实现对多重循环模式的控制。
在以甲苯为溶剂,乙酰丙酮镍和取代的烷基铝作催化剂的均相体系中,研究了氯原子和硝基取代基对催化剂性能的影响,并结合反应机理对其原因进了探讨。
在电力电子系统中,碳化硅(Si C)MOSFET的开关特性易受系统杂散参数的影响,表现为电磁能量脉冲形态属性的非理想特性,并进一步影响系统效率和可靠性。针对Si C MOSFET,首先分
用固-液相转移催化法由氯乙酸和2,4-二氯苯酚合成2,4-二氯苯氧乙酸。研究不同反应温度,催化剂对产率的影响。用聚乙二醇(PEG)400和KI双组分催化剂,得产率92%。
意识形态是中苏关系中一个敏感而尖锐的课题。可以说,中苏同盟因意识形态的同一性而建立,也因意识形态的背离而分裂。因此,从意识形态的角度来研究中苏关系的时异势迁,沧海桑田,无