推薦文檔列表

互操作聯(lián)邦數(shù)字圖書館研究

時間:2021-10-02 08:32:59 教育論文 我要投稿

互操作聯(lián)邦數(shù)字圖書館研究

 【內(nèi)容提要】未來的圖書館將是聯(lián)邦數(shù)字圖書館,其目標(biāo)是向用戶提供一個將異構(gòu)、分布信息源無縫集成的視圖,實現(xiàn)對數(shù)字圖書館資源的透明訪問。文中首先介紹了研究數(shù)字圖書館互操作的必要性,在此基礎(chǔ)上重點分析討論了聯(lián)邦數(shù)字圖書館的實現(xiàn)方法,并對當(dāng)前具有代表性的互操作聯(lián)邦數(shù)字圖書館的研究進(jìn)行了綜述討論,最后簡單討論了目前建立互操作聯(lián)邦數(shù)字圖書館所面臨的挑戰(zhàn)及進(jìn)一步研究和解決的問題。

【摘  要  題】專題探討……

互操作聯(lián)邦數(shù)字圖書館研究

       1 研究數(shù)字圖書館互操作的必要性

  隨著在線數(shù)字圖書館(DLs)的日益增多,人們發(fā)現(xiàn)必須訪問許多DLs才能找到所需要的資料。由于大多數(shù)DLs是基于數(shù)據(jù)庫驅(qū)動的,現(xiàn)有流行的搜索引擎不能對其內(nèi)容建立索引。因此,對于那些需要跨越多個DLs查找資料的用戶來說,搜索引擎不能滿足這種需求。如何將廣泛分布的、異構(gòu)的DLs聯(lián)合起來向用戶提供統(tǒng)一的服務(wù),即實現(xiàn)DLs之間的互操作,成為DLs研究與開發(fā)所關(guān)注的中心問題。

  所謂數(shù)字圖書館的互操作是指交換和共享DLs的文檔、查詢和服務(wù)的能力[1]。它要求來自技術(shù)(協(xié)議和格式等)、內(nèi)容(元數(shù)據(jù)及其語義等)和組織(DLs的基本訪問原則、支付方式和認(rèn)證等)三方面的合作。DLs的互操作可以出現(xiàn)在不同的抽象層次上,我們可以將其概括為兩類視圖[1]:縱向視圖(vertical  view)和橫向視圖(horizontal  view)。前者涉及法律、社會、文化和知識產(chǎn)權(quán)等方面的問題,后者涉及DLs的硬件和軟件即體系結(jié)構(gòu)方面的問題。

  為什么要研究DLs的互操作?道理很簡單:目前很少有DLs既提供豐富的館藏資源,又提供有效的服務(wù)。盡管目前一些DLs擁有大量的館藏資源,而另外一些DLs卻提供許多的服務(wù),但在這兩種情況下,用戶都不太容易找到其所需要的信息資源。只有在這些DLs之間實現(xiàn)互操作,才能共享DLs的資源和服務(wù)。因此,研究DLs的互操作是十分必要的。

      2 聯(lián)邦數(shù)字圖書館的實現(xiàn)方法

  為了解決用戶使用DLs查找資料時同一查詢條件的重復(fù)提交問題,人們提出了聯(lián)邦數(shù)字圖書館的概念。所謂聯(lián)邦數(shù)字圖書館是指正式或非正式合作操縱DLs的一些組織,它們同意支持一組共同的服務(wù)和標(biāo)準(zhǔn),以便在聯(lián)盟成員之間共享DLs的資源,實現(xiàn)互操作。聯(lián)邦數(shù)字圖書館允許跨越不同的DLs執(zhí)行搜索,并將每個DLs的查詢結(jié)果合并后返回給用戶,使用戶感到如同使用單個數(shù)字圖書館一樣。從聯(lián)邦的耦合度考慮,實現(xiàn)聯(lián)邦數(shù)字圖書館的方法可分為以下三種:NCSTRL方法、Harvesting方法和搜集(Gathering)方法。

    2.1 NCSTRL方法

  網(wǎng)上計算機科學(xué)技術(shù)報告圖書館(NCSTRL)是一個擁有100多個機構(gòu)加盟的聯(lián)邦數(shù)字圖書館[2],它利用Dienst作為DLs的協(xié)議和體系結(jié)構(gòu)。凡是要求加入NCSTRL的機構(gòu)需要在本地安裝Dienst服務(wù)器,并按照統(tǒng)一規(guī)定的數(shù)據(jù)格式建立其館藏資源。NCSTRL借助于分布式搜索技術(shù)在聯(lián)盟DLs之間實現(xiàn)資源共享,它將用戶的查詢送往參與聯(lián)邦的所有DLs上分別執(zhí)行,收集返回的結(jié)果,綜合整理后返回給用戶(圖1)。

  附圖

  圖1 NCSTRL方法

  NCSTRL方法要求所有參與聯(lián)邦的DLs使用相同的協(xié)議或軟件系統(tǒng),因此能夠提供全面的互操作。但緊密的聯(lián)邦必將加重聯(lián)盟成員的負(fù)擔(dān),它們不得不就技術(shù)標(biāo)準(zhǔn)和策略(如知識產(chǎn)權(quán)準(zhǔn)則、安全和隱私等)達(dá)成一致。從網(wǎng)絡(luò)和搜索系統(tǒng)方面的限制考慮,NCSTRL是昂貴的運行模式,因為要求每個聯(lián)盟成員的DLs必須支持復(fù)雜的查詢語言和對查詢的快速實時響應(yīng)。另外,從查詢的頻率、元數(shù)據(jù)的質(zhì)量以及網(wǎng)絡(luò)資源的可用性等方面綜合考慮,這種實現(xiàn)聯(lián)邦的方法對聯(lián)盟成員加負(fù)較重。因此,只有那些需求強烈的DLs會采用這種代價較高的模式。

[1] [2] [3] [4] [5] [6]