机器学习算法在文本信息挖掘中的应用

来源 :网络安全技术与应用 | 被引量 : 2次 | 上传用户:wumujiayou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展和进步,其已经在电子政务、电子商务、金融证券、电力通信等行业得到广泛使用,提高了社会信息化水平,也使人类社会进入到"互联网+"时代,积累了海量的信息资源。文本是网络文件的一种重要格式文件,百度、搜狐、搜狗、谷歌等搜索引擎多采用文本搜索模式,以便获取人们期望的信息,因此需要提高挖掘文本信息的准确度,进一步满足人们对信息检索的期望。本文详细地分析了支持向量机、BP神经网络、K均值等机器学习算法,分析了这些算法在文本数据挖掘中的应用效果及优势,以提升互联网利用文本数据的水平。
其他文献
(上接2006年第2期)3.3.10显像剂3.3.10.1型式:提供的a、d和e型显像剂应该是已经混合成准备使用的状态而不需要作进一步的稀释。b和c型显像剂应以浓缩状态提供并需要按照制造
目的研究安徽省一般人群外周血淋巴细胞核分裂指数(NDI)的参考值范围,并分析可能的影响因素。方法2010-2011年在安徽地区招募无职业性遗传毒物接触史及慢性疾病史的一般人群281名。采用调查问卷的方式收集调查对象的年龄、性别、地区、职业暴露史、BMI、吸烟和饮酒状况等信息,采集被调查者外周血,通过胞质分裂阻滞法微核组学计算NDI,分析影响因素,并以NDI为因变量,年龄、性别等因素为自变量采用多重
目的 探讨甲苯二异氰酸酯(TDI)职业暴露对血清中基质金属蛋白酶-9(MMP-9)和金属蛋白酶组织抑制剂-1 (TIMP-1)水平的影响及其与肺功能的相关性.方法 采用横断面研究设计,于201
【摘 要】根据电源管理系统多负载以及负载轻重程度不同等实际应用情况,提出一单电感双输出(Single Inductor Dual Output, SIDO)Buck控制器作为探测器系统的能量分配单元,由于两个负载共用一个电感,其中一个负载的变化很可能对另外一个负载造成影响(交叉干扰),且考虑降低系统噪声,折衷考虑后采用电感电流伪连续导通模式 (Psuedo Continuous Conductio
期刊
期刊
数据挖掘作为一门迅速发展的研究领域,面临着越来越多新的问题和挑战。数据挖掘在科技、航空、军事等多个领域得到了广泛应用,甚至直接决定了行业的发展速度和先进性,但是在实践当中,同样存在许多的问题。本文根据数据挖掘的特性展开分析,以特征加权与特征选择的方法进行计算。
目的探讨职业慢性心理应激与血清热休克蛋白70(HSP70)和肿瘤坏死因子-α(TNF-α)的关系。方法采用病例-对照研究设计,于2011年10月—2012年10月,选取宁夏回族自治区2家医院中确诊的20~ 60岁无血缘关系的代谢综合征(MS)患者作为病例组,共计622例。同期选取前往上述2家医院进行健康体检的健康人群作为对照组,共600名。通过问卷方式调查研究对象性别、年龄、民族、身高、体重、吸烟
提出了JB/T 4730.2—2005《承压设备无损检测》中关于照相灵敏度值得注意的七个问题,并就各个问题谈了自己的看法。对射线检测人员理解标准条文有一定的帮助作用。 This pap
目的 探寻与囊型包虫病患者包囊钙化相关的基因,从分子生物学水平提供判断患者预后情况的依据.方法 于2013年6月至2014年12月,收集前往宁夏3家医院就诊的32例囊型包虫病患者(