一种针对App描述文本的深层次特征提取方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:d517441645
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着手机等移动智能设备的普及,运行在这些设备上的App软件也得到了快速发展。随之产生的App应用商店,在为用户下载App提供便利的同时,也带来激烈的产品竞争。一款App想要在应用商店中立足,了解同类产品所具有的功能以及功能的细节特点是十分重要的。然而,应用市场中包含大量的App产品,在产品经理设计一款App功能时,很难全面了解所有同类产品。针对这一问题,本文提出了基于深层次特征的竞争分析(DFCA)方法,为产品经理进行竞争者分析提供帮助。App描述是开发人员向用户介绍其产品的说明文档。为了吸引用户下载,在App描述文档中开发人员都会对产品的特点进行详细介绍,所以描述文档中蕴含着丰富的App功能信息。同时自然语言处理技术的发展,为挖掘这些蕴含在App描述文档中的相关信息提供了技术支持,而得到的这些相关信息又可作为同类产品比较的依据帮助产品经理进行竞争者分析。本文基于自然语言处理、数据挖掘等方法,结合App软件工程特点,对App描述文档进行了研究,旨在帮助产品经理高效地分析同类产品的描述文档,了解同类产品状况,从而更好的进行竞争产品分析。本文的主要研究内容如下:(1)设计从App描述文档中提取描述App特征的方法。特征是存在于App相关文档中描述软件功能的单词序列,许多现有的App信息挖掘工作都是围绕特征提取展开。为了更深入地比较相似App功能,本文在现有工作的基础上定义了一种新的App特征,能够同时包含软件的功能以及细节信息。并且本文使用词性标记工具,对App描述文档逐层划分,逐步确定App特征成分,最终从App描述文档中准确的提取这种App特征。(2)给出竞争信息挖掘方法。本文进一步处理从App描述文档中抽取的特征,从中挖掘竞争信息展示给产品经理。首先,为了寻找相似特征,本文根据实际情况,设计一种计算特征相似度的算法。采用这个算法,可以对特征聚类,可以将描述相似App功能的特征聚集在一起。之后,本文对相似特征的细节信息进行进一步的处理,从而分析出相似的功能的不同特点,帮助产品经理进行深层次的比较。综上所述,本文对App描述进行分析,以特征提取的方式从描述文档中抽取App功能相关信息。给出了一套自动化分析比较相似App功能的方法,为产品经理进行相似产品分析提供帮助。并为自然语言处理、文本挖掘等技术在软件工程中的使用提供借鉴。
其他文献
关于商业实践中企业成长机理的研究从来不乏学者关注。然而,网络经济时代兴起的电商平台企业,频繁通过整合产业链实施创新运营模式,进而实现企业快速成长的逻辑机理仍有待理
行人重识别(Person Re-Identification,ReID)是利用计算机视觉技术判断不同监控摄设备拍摄到的行人是否属于同一行人的技术,在智能安防、刑侦检测等领域具有良好的应用前景。近年来,以深度卷积网为代表的深度学习方法在计算机视觉领域取得了突破性成果,但深度学习往往需要大量的训练数据。迁移学习(Transfer Learning)的目的是利用已有的知识和经验来解决不同但相关领域的新任
由集料性能差异引起的沥青-集料粘附性不足是导致沥青路面出现破坏现象的主要原因之一,它与沥青路面的松散剥落、水损害、耐久性以及沥青混合料的强度、低温抗裂性等有着直接
无线网络在物联网中有着举足轻重的地位,而智能家居中的无线网络更多是属于无线传感器网络,设计它们的协议时,还要考虑能耗的问题。无线网络协议族中的一个重要协议是邻居发
我国大部分城市位于地震烈度为七度或者七度以上的高烈度区,随着城市的大规模建设,高烈度地震区的隧道越来越多,其抗震问题日益受到人们的重视。汶川大地震与青海玉树地震导
面向服务的体系架构SOA(Service Oriented Architecture)基于服务来组织计算资源,具有良好的互操作性和松耦合性,促进了分布式计算和软件技术的发展。它的主要内容Web服务的应用受到了广泛关注,但是单个的Web服务并不能很好地满足用户日益增长的需求,通过某种技术将现有的细粒度服务集成起来以提供功能更强大的服务,可以很好地解决这个问题。BPEL(Business Proces
阳极支撑型微管式固体氧化物燃料电池(Anode-supported Micro Tubular Solid Oxide Fuel Cell,MT-SOFC)因其体积小,机械强度高,导电性强,传质传热面积大等优点受到了广泛关注
在生物医学研究中,估计疾病的患病率是一个重要的研究课题。筛检方法虽然价格便宜,能迅速得到检测结果,但是常常出现误分判数据,而基于误分类数据得到的估计是有偏的;另一方
砂卵石层是北京地铁施工主要地层之一,其密实度高、饱和抗压强度大,盾构隧道施工过程中刀盘磨损快与单次掘进距离要求长的矛盾突出,是当前急需解决的关键难题之一。当前,刀盘
随着当代信息技术的发展和进步,信息化社会的不断发展使得我们对数据处理的能力要求越来越高,传统的数据处理方法已经不能满足需求,因此如何利用机器来进行信息处理和大数据