【摘 要】
:
随着互联网的发展,针对特定用户的互联网调查已经是一种基本的获取所需统计信息的方法。然而,对于非专业人员,编制一张互联网调查表并做相应统计非常困难.即使是专业人员,编制起来也相当繁琐.因此,如果能够向用户提供SaaS(软件即服务),按用户的需求自动生成调查表并做出相应的调查统计,就大大减少了用户的麻烦.在详细考察了用户需求及系统易用性的基础上,对互联网调查表自动生成系统的体系架构和功能模块进行了设计
【机 构】
:
清华大学信息技术研究院Web与软件技术研究中心 北京 100084
【出 处】
:
第二十五届中国数据库学术会议(NDBC2008)
论文部分内容阅读
随着互联网的发展,针对特定用户的互联网调查已经是一种基本的获取所需统计信息的方法。然而,对于非专业人员,编制一张互联网调查表并做相应统计非常困难.即使是专业人员,编制起来也相当繁琐.因此,如果能够向用户提供SaaS(软件即服务),按用户的需求自动生成调查表并做出相应的调查统计,就大大减少了用户的麻烦.在详细考察了用户需求及系统易用性的基础上,对互联网调查表自动生成系统的体系架构和功能模块进行了设计,并给出了其基于SCA架构的实现:Internet Investigation Auto Generation System(FAGS).实验证明,该系统可以为互联网用户提供可定制的调查服务,有效地节省用户的时间和精力.
其他文献
传感器网络的覆盖问题是无线传感器网络研究和应用的关键性基础问题,直接影响着传感器网络的使用性能.针对移动传感器网络中节点自由分布时网络覆盖率低下的问题,研究了达到对监测区域的完全覆盖时的节点最优分布情况,提出了一种能够利用节点的可移动性,在使用尽可能少的节点和尽量节省能量的前提下,近似实现这种完全覆盖的节点重定位策略.实验结果表明,该策略可以大大提高无线传感器网络的覆盖程度.
Wrapper的生成与维护是Deep Web数据集成中一项非常重要的研究课题。传统的方法通常是通过对网页结构或特征的分析来推导Wrapper,这种方法严重依赖于网站模板,在处理某些网站时可能完全失效.同时,以往研究对于Wrapper的维护问题关注较少.这两个问题导致无法真正实现大规模Deep Web数据集成.提出了一种新颖的数据驱动的Wrapper自动生成与维护方法。这种方法利用同一领域不同网站之
目前基于链接关系的排序算法在互联网搜索引擎中起着至关重要的作用。这类算法的提出是以"链接即投票"的假设为前提的.但是随着互联网商业化发展十几年来,这种假设已经不是万能的了.网页之间不再是"投票"关系,有各种各样其他角色的链接(即噪链)充斥其中,噪链的存在降低了基于链接的排序算法的准确性,如何识别和处理噪链是当今国外研究的热点.根据噪链本身的分布特性,提出了一种只基于链接关系就能自动识别和过滤噪链的
在无线传感器网络中,传感器节点间的通信是电池能量的主要消耗者,如何尽可能降低网络中的通信代价,在网络中有效地利用能源计算出数据轮廓,成为当前的研究热点.现有的能量有效的映射过滤算法(EES)是将滑动窗口内的数据映射为整型,以此来缩短节点间传递数据长度,同时利用映射元组设置过滤器的方式来减少通信代价,由于其映射函数是将等距范围内的数据映射为同一个整数,在过滤对计算数据轮廓意义较小的元组时,其过滤性能
从特定领域的多个Web服务中自动抽取出描述其功能特征的主题信息,利于服务分类管理、高效服务发现及合成.将WSDL文档中的服务、操作、输入和输出参数名作为服务描述的要素(称为项),基于对多个WSDL文档中各项的统计计算,分别提出项权重和项集语义覆盖度的概念,并给出基于这两个语义度量标准的关键项自动抽取算法,进而得到以关键项集描述的Web服务主题。实验结果表明,提出的服务主题自动抽取方法具有较高的效率
为支持越来越多Internet和Web应用的高性能、实时性、高可用性和高可靠性等要求,设计了一种3层结构的实时容错数据库及其全更新同步复制模型,并讨论了一个基于多数的两阶段实时同步复制协议2PRTSR.该协议考虑了事务定时限制,放松了全局决定(提交或夭折)的条件并提供事务"重试"和"丢弃"机制.该协议既能保证数据的一致性,又可节约系统资源和提高系统可用性。性能测试结果表明所给出的方法在满足事务平均
由于RFID技术采用的无线射频信号极易受外界条件干扰,导致RFID数据采集过程中漏读现象频频发生,降低了RFID应用中查询结果的准确性。目前解决漏读问题的算法主要是基于数据层的,这种做法会填补许多与查询无关的数据,浪费系统资源。在逻辑区域层的基础上提出了两种基于动态事件概率模型的数据清洗算法,即贪婪算法和相似度算法。它们主要对已知的数据进行学习来预测未知的数据.大量实验证明了该数据清洗算法的有效性
ACOM是一种基于物件(artifact)的有效的业务流程建模方法。现有研究表明基于物件实例的生命周期可达性问题是一个不可判定问题。提出了一种BR-artifact模型,该模型引入了业务规则约束的物件依赖关系,通过分析物件实例的生命周期和关键物件(key-artifact)实例的作用,构造了基于物件实例状态迁移的有限状态执行图,从而将生命周期可达性问题转化为状态执行图上的图可达性问题,即可判定性问
突发检测是数据流的固有问题之一,因其应用广泛而备受研究者关注.突发检测中的一个基本问题是如何保存数据流中所有元素的频数.提出了一个基于改良的计数型布卢姆过滤器BCBF+HSet保存所有元素频数的解决方案.与直观的数组存储方式相比,虽然引入了一定的错误率,但能显著减少存储空间.与两个经典的计数型布卢姆过滤器CBF和DCF相比,BCBF+HSet在存储空间、计算复杂性及错误率上更加适合数据流突发的情形
提出了一种基于RDBMS的粒度可自动调节的XML索引结构AX-Tree,它是一种根据结点的路径信息建立的树状分层索引.AX-Tree能根据XML文档的结构分布自动调整索引结点的聚类粒度,寻求索引扫描速度和筛选能力之间的平衡,以达到更优的查询性能.展示了AX-Tree索引的结构及其构造算法、查询算法,并实验证明了AX-Tree索引的查询性能和文档适应能力.AX-Tree另一重要特性是索引基于关系数据