基于潜在狄利克雷分配模型和互信息的无监督特征选取法

来源 :计算机应用 | 被引量 : 5次 | 上传用户：taiguomin

【摘要】

：

为解决互信息(MI)在特征选取中的类别缺失和倾向低频词问题,提出LDA-σ方法。该方法使用潜在狄利克雷分配模型(LDA)提取潜在主题,以"词—主题"间互信息的标准差作为特征评估函数。在Reuters-21578语料集上提取特征词并进行分类,LDA-σ方法的微平均F1最高达0.9096;宏平均F1优于其他算法,最高达0.7823。实验表明,LDA-σ方法可用于文本特征选取。

【作者】

：

董元元陈基漓唐小侠

【机构】

：

桂林理工大学信息科学与工程学院,桂林理工大学理学院

【出处】

：

计算机应用

【发表日期】

：

2012年08期

【关键词】

：

潜在狄利克雷分配模型互信息评价函数 Latent Dirichlet Allocation （LDA） model Mutual Information （

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

模拟器助力，重拾童年记忆

手机刚买来几个月，那些主流的手机游戏就已经被我玩了个七七八八。如今弹射小鸟时已经没了当初的精神头，汤姆猫也不再觉得那么调皮可爱，切水果更是切到望而生厌……。我开始怀念

期刊

模拟器记忆童年手机游戏游戏画面电视机游戏币APP

用好你的iOS，苹果让生活更简单

曾几何时，我们对手机的需求就是打打电话、发发短信而已，直到有一天一个叫iPhone的东西出现了，它令许多人为之痴迷。iPhone不再仅仅是一部手机，它可以让我们的生活更简单、更有乐

期刊

生活IOSIPHONE苹果电话手机发短信

如何加强对信息技术和学科整合的实践应用

所谓信息技术和学科整合就是说教师在培养和指导学生时，既要传授给学生较为专业的信息技术知识，又要注重不断加强学生对信息技术的实践和运用，这样才能全面培养学生掌握的信息技

期刊

学科整合信息技术实践应用

价值链中的利润转移研究--基于经济学视角

随着经济社会的发展，利润沿着价值链发生了转移。本文对过剩经济条件下利润在价值链上发生的4种转移规律做出经济学解释，并为企业如何应对这种转移提出建议。

期刊

过剩价值链利润转移

苏开家拖、抗耕地占用税松滋法院依法强制执行

松滋县纸厂河镇飞仙观村五组村民苏开家长期拖、抗耕地占用税不交,松滋县人民法院最近依法对其实行强制执行。至此,这起拖延长达八个月之久的执行案件划上了句号。去年八月

期刊

强制执行耕地占用税松滋县纸厂河镇占地面积仙观三间强制措施内交施延

自拍也可以精彩无限

据统计，在自拍流行的今天，有80％以上的年轻人都曾拿着相机或手机对自己“咔嚓”。不过，自拍绝不仅仅就是手持相机然后45°仰望，其实它也有极大的创作空间。只要借助一些工具并

期刊

自拍创作空间年轻人相机

揭秘淘宝泄漏个人隐私的途径

泄密，又是泄密，上一个泄密事件才把俺震得晕头转向，这咋就又来了，还让不让人活了？神马!还是淘宝？我的支付宝上可是有不少的银子呢，肿么办7

期刊

个人隐私泄漏泄密事件

隐私安全谁保障？我的权限我做主！

安全哨岗话说这前段时间各大网站的密码泄漏事件，真是把互联网搅了个天翻地覆。作为一名常年混迹于各种论坛、博客、门户和社交网站的老网民，我可是改密码改到手抽筋。回过神来，突然想起我这天天不离身的Android手机一样是把上网好手，而且手机中各类隐私资料的安全—包括联系人、通话记录、短信甚至我所在的地理位置等，更加令人担忧。电脑上的安全工作我虽一点不含糊，可这被乱七八糟应用堆满的手机该如何把好资料的“安

期刊

隐私安全保障权限通话记录地理位置安全工作互联网联系人

应用Logistic方程的RED改进算法

为了降低丢包率,通过对线性增长的随机早期检测(RED)算法进行研究改进,引入了Logistic方程的方法来计算丢包率;并通过仿真实验对LGRED和NLRED的实验结果进行了比较,发现LGRED相对于RED的丢包率降低了约28.83%。实验结果表明:在相同的参数条件下,LGRED算法更加能够控制丢包的发生,提高网络性能。

期刊

随机早期检测LOGISTIC方程丢包率网络性能仿真实验Random Early Detection （RED） Logistic equation p

我省利用世行贷款工作取得重大进展

9月2日,第六次全国世行贷款管理工作会议在汉召开.财政部世界银行和官员说:“湖北省到会年6月底止,利用世行贷款项目22个,贷款额为46654万美元.通过中间金融机构转贷的15个项

期刊

利用世行贷款贷款管理转贷金融机构经济发展建设地区经济政网投资结构社会事业

基于潜在狄利克雷分配模型和互信息的无监督特征选取法

与本文相关的学术论文