论文部分内容阅读
网络资源是指通过互联网传播共享、以文件目录为主要存储组织结构的内容,如书、讲义、音乐等。每个资源的内容具有完整独立性。它们是数字图书馆、教学资源库、专业内容库藏的重要组成。网络资源的一大特点是命名模式不规范,给检索利用带来极大不便。本文以2003~2006年间搜集的61万文件构成的16 284个网络资源为对象,用统计的方法考察网络资源命名特点及其中体现的用户命名习惯。包括资源及其内部子目录、文件的名字长度分布,字符类型熵、常用符号、高频片段模式、语义类型等,并分析无序命名中蕴含的用户命名习惯。本文的意义一