书目查重技术

书目查重功能贯穿于冠景书店业务系统的全部过程中,是核心的系统功能之一。图书馆行业的查重包括采访查重、编目查重和分类查重等,冠景公司重点关注的是馆配行业中图书馆和书店共同关心的采访查重,采访查重的目的是确定图书品种是否已经订购过的,确定是否需要重新订购或追加复本。 查重要素包括四个方面:源数据、目标数据库、检索点、输出数据。为了更好实现查重,需根据工作要求对各查重要素支持足够充分,对源数据的要求是既能支持MARC数据,也能支持Excel数据;对数据库的要求是能支持一个库查重,也要支持跨库查重;对检索点要求是既可以单检索点检索,也可以多检索点组合检索;输出数据可以根据源数据类型自动分为查到的和没有查到的两部分。冠景公司的查重模块配合TopDB数据库中间件,实现了对四个要素的充分支持,查重效率非常高。 大多数查重都是以ISBN作首选的查重点,在目标数据库中搜索,命中的为查到,未命中的是没有查到。由于ISBN本身的发展,冠景TopDB数据库系统特别增加了10位和13位ISBN通查的功能,解决了升位后ISBN不重的问题。另外,为了解决没有ISBN的出版物查重问题,冠景软件中设计了查重主键和附键,将ISBN、标准号、统一书号设置在主键,任选其一作为主查重点,然后将书名、出版社等其他检索点作为附键参与组合检索。 为了解决非检索点信息的查重,冠景软件中设计了智能查重的js接口,主要解决著录不规范统一的问题。考虑到在价格、卷册号、出版时间、页码等信息著录上常见的著录不统一的问题,js脚本进行智能匹配,将形式上不同而内容上相同的数据,自动判断为重。

Copyright@2005-2011 北京冠景软件有限公司 京ICP备09004974号

京公网安备11010802008567号 邮箱:1667901817@qq.com

QQ:1667901817 电话:13263197698