论文部分内容阅读
控制关系分析(Dominant Relationship)成为数据库领域研究人员关注的一个热点问题。控制关系分析在很多的领域,比如Skyline计算,Rank-Aware查询的处理以及市场分析中都有非常广泛的应用。 之前的工作在考虑将控制关系应用于市场中产品与顾客之间的控制关系分析时指出当一个产品在所有属性上都比顾客的需求好时,该产品就能控制该顾客,即该产品-满足顾客各方面的要求,顾客在需要购买此类产品的时候可能会选择该产品。 但是由上面的控制关系定义可以看出,一个产品能够控制一个顾客的重要条件就是该产品在所有属性上都不比用户期望值差,并且至少在一个属性上比用户期望值好。对于一个实际的产品(比如笔记本电脑)而言,要想所有的属性(质量,重量,价格…)都比顾客的期望值好,这样的控制关系显然过于严格。 本文针对竞争市场情况下产品市场定位的问题以及之前工作中的不足,本文首先提出了一种新的基于k-最近邻居(k-Nearest Neighbor,kNN)的控制关系定义。在新的定义中,如果一个产品属于某顾客的k最近邻居,则说该顾客能够被该产品控制。然后基于这种新的控制关系,本文研究了市场竞争以及资源有限条件下,如何给予kNN控制关系分析产品市场定位的问题。 基于kNN的控制关系由于基于空间欧几里德距离,使得该方法只能用于处理数值型数据,而在现实世界中产品有大量的文本属性,本文仔细分析了文本属性对于产品市场定位问题的影响,提出了基于Constrained-kNN的控制关系用于分析含有文本属性的产品市场定位问题。 最后,本文还就不同用户具有不同需求的问题,提出了一种考虑个性化的产品控制关系分析方法Threshold-CkNN(TCkNN)。 本文工作主要有五点贡献,归纳如下: 1.针对产品市场定位问题,提出了一种较之已有工作更为合理的产品分析比较方法(基于kNN的控制关系分析),并针对线形优化问题给出了有效的解法用于为企业市场定位提供决策上的支持。 2.提出了一种改良的产品分析比较方法(基于CkNN的控制关系分析)用于处理产品具有文本属性的情况。 3.提出了一种基于用户描述的考虑个性化的产品分析比较方法(基于TCkNN的控制关系),用于处理市场中用户偏好不尽相同的情况。 4.考虑了提出了解决方案对于复杂市场分析查询的支持,并给出了有效的解决方案。 5.大量的实验分析验证了本文提出的方法具有良好的性能,能够有效地分析处理大规模数据。