|
民族學學科信息門戶的資源組織的實現(xiàn)方式探析
精品源自作文園地 學科信息門戶(Subject Information Gateway, SIG)是指把某學科(專題)網(wǎng)絡資源、工具與服務進行整合,并在一個可定制個性化服務的界面,為用戶提供一個同一協(xié)作的學術交流環(huán)境。在國外,這種組織模式幾乎覆蓋了所有的學科。中國學科信息門戶研究與建設始于2001年,從涵蓋的學科來看,主要涉及自然科學的基礎學科和應用學科,而有關社會科學的學科門類卻很少。目前中國國家數(shù)字圖書館等多家單位建設了民族文化和研究數(shù)據(jù)庫50多個,在因特網(wǎng)上還有大量的介紹一個或多個民族文化和民族研究信息的網(wǎng)站以及一些商用數(shù)據(jù)庫中也有大量的民族研究資料。這些數(shù)據(jù)庫、網(wǎng)站由于是使用不同的硬件系統(tǒng)、平臺與軟件建設,致使:一是用戶在使用這些數(shù)據(jù)庫時,面臨著各種規(guī)模的數(shù)據(jù)庫、多媒體和分布式體系結構的選擇。檢索過程中的權限要求與IP驗證,檢索結果中出現(xiàn)的死鏈、大量無用或重復信息等障礙,使民族科研用戶難以在一個集成化信息檢索平臺上一站式獲取和處理自己所需信息。二是這些數(shù)據(jù)庫與數(shù)據(jù)庫之間、網(wǎng)站與網(wǎng)站之間沒有互聯(lián)互通,無法進行資源共享和綜合利用,實際上形成了一個個信息孤島。 欲解決這些問題就需要把民族研究數(shù)據(jù)庫以及民族網(wǎng)站信息資源進行集成化,以利于廣泛的利用。而民族學學科信息門戶的資源集成正是學科專家和專業(yè)館員利用門戶重新組織網(wǎng)絡上的本學科信息,對這些資源進行詳細的元數(shù)據(jù)描述并提供指向資源的鏈接,可以說民族學學科信息門戶的資源組織是民族學數(shù)字信息集成的最好實現(xiàn)形式。本文試對民族學學科信息門戶的資源組織的實現(xiàn)方式作一分析。 一、構建合理的民族學學科信息資源分類體系 分類體系既是對民族學學科信息門戶收集的資源實施組織,也是便于用戶基于學科分類進行資源瀏覽與檢索的有效途徑。從國內外已建設的學科信息門戶看,大型的學科信息門戶網(wǎng)站都通過使用合理的分類體系和詞表提供高質量的服務。國外用于組織資源的分類法有DDC、UDC、LCC、EI、NLM以及自編的分類類目;國內使用的分類法有《中圖法》、《科圖法》、DDC以及參照相關的國際標準建立的分類體系。對于民族學學科門戶資源組織的分類類目的設定,使用國內的分類法設置較為合理,且《中圖法》的使用有廣泛的基礎。但直接把《中圖法》的民族學類目作為學科信息門戶的類目,又不利于資源組織。在《中圖法》中,總論民族學的類目設置在“社會科學總論”大類下,其他專論各民族的有關學科均入相關學科類,作為信息門戶資源組織的學科分類需要對類目進行調整。根據(jù)《中圖法》的列類原則、參考教育部《學科分類與代碼》(GB/T13745-92),結合民族學的學科發(fā)展和研究文獻的分布、數(shù)據(jù)庫建設的種類,并考慮用戶的使用習慣,把民族學分成下列類目: 在二級類目下再根據(jù)信息量的多少細分,這樣就形成一個10個大類、50幾個二級類目和若干小類的類目體系。 二、構建民族學學科敘詞表 受控詞表的運用既可以保證資源描述的準確性,又利于實現(xiàn)本學科或專題的深入檢索。國內外大部份學科信息門戶大都使用了受控詞表來描述資源,也有的用自編詞表。民族學領域目前沒有專門的受控詞表。就我國的學科信息門戶建設而言,把《中國分類主題詞表》 (以下簡稱《中分表》)作為受控詞表有較高的參考價值。但由于《中分表》是面向所有學科使用的,直接用于民族學學科信息門戶的資源組織有一定的困難。需要采取:一是要增設民族學科主題詞。大量的民族學學科主題詞,在《中分表》中沒有體現(xiàn)。例如,在《中分表》中有侗族的“侗戲”主題詞,無侗族的“侗族大歌”主題詞,侗族大歌和侗戲都是侗民族喜聞樂見的藝術形式,但侗族大歌更有影響力;再如,“口承文化”是無文字民族甚至是有文字民族傳承文化的一種形式,《中分表》缺少這樣的主題詞。在進行資源組織時需增設民族學學科主題詞。二是不斷添加民族學新詞匯!吨蟹直怼纷鳛橐环N先組式和后組式語言兼容的分類主題一體化詞表,是不能隨時插入學科主題詞的,且《中分表》修訂周期過長,詞匯更新滯后。學科發(fā)展又在不斷增加新的詞匯,在民族研究領域就出現(xiàn)了大量的學科新詞,諸如非物質文化遺產、游牧文化、無字文化、文化植被、瀕危語言、虛擬博物館等。對于“非物質文化遺產”這類的詞,可以說是民族學研究領域的高頻詞,在《中分表》中就沒有體現(xiàn)。學科信息門戶是一個學科信息的集成平臺,信息門戶資源組織需要及時增加本學科領域的新詞匯,反映學科研究動態(tài)。所以在民族學學科信息門戶建設中需組織本領域的專家以《中分表》為基表,從中抽取所有有關民族學以及相關學科的詞匯;增補民族學領域中專業(yè)詞匯和學科新詞;增加自然語言的檢索詞,增大檢索入口,使用相關和參照關系等體現(xiàn)主題詞與自然語言檢索詞,編制《民族學學科敘詞表》作為受控詞表,以實現(xiàn)本專業(yè)的深入檢索。同時要關注和引入本體論等語義相關技術,構建民族學領域本體,更好地解決門戶間的互操作、知識整合、個性化服務等問題。 三、創(chuàng)建民族學領域本體 為適應門戶的發(fā)展,多層次、多功能地表現(xiàn)民族學概念之間的關系,便于用戶進行聯(lián)想和可視化檢索,使民族信息資源能夠在用戶與用戶之間以及各種異構系統(tǒng)之間進行廣泛的交流與知識共享,可利用民族敘詞表和本體(Ontology)在表達知識概念結構上的關系,創(chuàng)建民族學領域本體。目前在國際上已有通用的本體描述語言,如W3C工作組于2004年正式推薦的標準網(wǎng)絡本體描述語言(Web Ontology Language,簡稱OWL);有實現(xiàn)本體構建的工具WebODE、Prote' ge'、Ontosaurus等以及構建本體的方法;有本體運用于藝術和農業(yè)信息系統(tǒng)的范例,這些對民族學本體構建均有借鑒意義。民族學領域本體的構建是需要實現(xiàn)民族學領域的敘詞表到知識本體進行轉化的過程,但其轉換不是一個直接的大規(guī)模詞表轉換,而是需要把一個領域分成若干的概念類,逐個類目的建立。例如,以流傳于甘、青、寧、新部分地區(qū)獨特的民間藝術“花兒”為例。使用本體構建工具,建立概念(類):“花兒”概念,其下位類為“河州型花兒”、“洮岷型花兒”;建立屬性,且是每一個下位類都具有的屬性。使用“句”、“令(曲調)”、“襯詞”;然后分別建立實例;同時還需設置等同與相關關系,因“花兒”民歌涉及民間詩學、民間音樂、民俗學、社會學、語言學、歷史學、民族學、人類學,所以可使用“別類”,把上述概念進行相關關系的顯示。這樣在語義系統(tǒng)中就構成了一個可視的“花兒”概念(類)完整意義的本體。 民族學本體的構建是一個系統(tǒng)工程,涉及民族學領域專家對本領域知識概念及概念詞之間關系的確定、信息管理人員對知識概念的組織和計算機軟件工程人員在本領域內的開發(fā),這里只是作一個引子,以期引起民族學學科信息門戶建設者的關注。 四、把元數(shù)據(jù)描述作為基本方法 要使民族學信息資源實現(xiàn)科學的知識組織,在提供民族學學科信息的檢索、瀏覽、鏈接的方便性和相關性的同時,保證其個性化信息服務得以充分體現(xiàn)。需通過元數(shù)據(jù)描述以下方式實現(xiàn)。 元數(shù)據(jù)是描述、組織和發(fā)現(xiàn)因特網(wǎng)上信息資源的有效工具,它通過描述數(shù)據(jù)的內容和本質特征,存儲相應的檢索路徑,便于識別資源、評價資源,追蹤資源在使用過程中的變化,實現(xiàn)簡單高效地管理大量網(wǎng)絡化數(shù)據(jù),實現(xiàn)信息資源的有效發(fā)現(xiàn)、查找、一體化組織和對使用資源的有效管理。元數(shù)據(jù)作為學科信息門戶的基本信息組織方法,是每一個學科信息門戶建設中都須面臨的選擇。目前國際上很多門戶使用通用簡單的DC(都柏林核心元數(shù)據(jù))。我國多家單位在民族學數(shù)字資源建設中使用的元數(shù)據(jù)標準有很多,其中電子圖書、期刊論文、會議文獻、學位論文、地方志等數(shù)據(jù)庫絕大部分是等同采用國家科技部科技基礎平臺工作重點項目《我國數(shù)字圖書館標準規(guī)范建設》子項目《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范》,但對視頻、音頻、照片等類型的數(shù)字資源組織,采用了不同的元數(shù)據(jù)標準。要建立民族學學科信息門戶首要的是選擇合適的通用的標準元數(shù)據(jù)格式,民族學學科信息門戶的元數(shù)據(jù)可以參照《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范》,作為基本的元數(shù)據(jù)。但在視頻、音頻標準上,需要選擇符合民族學學科信息的元數(shù)據(jù)。例如,在責任主體元數(shù)據(jù)項,須增加少數(shù)民族文化傳承方式的“口述”、“傳承”等元數(shù)據(jù)元素。同時在民族學學科信息門戶中要建立包含元數(shù)據(jù)以及實現(xiàn)門戶元數(shù)據(jù)格式的轉換和網(wǎng)絡中不同元數(shù)據(jù)的互操作的功能庫。只有這樣,才能保證民族信息在不同結構的信息源中傳輸不失真。 五、要注重民族學學科的個性化信息資源的知識挖掘 在國外,門戶建設已有十幾年的歷史,門戶已趨于成熟,為各自的學科發(fā)揮著重要的作用。國內學科信息門戶建設近幾年發(fā)展也很快,但建設的門戶普遍存在資源的可用性和易用性差。多數(shù)門戶是封閉的,無法實現(xiàn)用戶的交互性和用戶資源的共享,門戶資源利用率低。而用戶呼喚門戶朝“5C化”發(fā)展,即用戶化(Customization),適應不同用戶對信息獲取的不同需求和興趣;商業(yè)化(Commerce),為用戶提供商務方面的服務;溝通化(Communication),用電子郵件,網(wǎng)上會議等通訊工具在網(wǎng)站和用戶之間、用戶與用戶之間架起信息溝通的橋梁;社區(qū)化(Community),為用戶提供彼此可以互相交流,互相學習和互相幫助的虛擬空間;兼容化(Compatibility),即能夠讓一個虛擬圖書館系統(tǒng)和使用不同平臺的相關技術和服務實現(xiàn)無縫對接,為用戶創(chuàng)造一個完整、友好的界面。用戶的需求是門戶建設的源動力,也促使民族學學科信息門戶建設者思考其門戶資源的組織模式,以適應民族學學科信息門戶快速發(fā)展。 民族學學科信息門戶建立的最終目的是通過建立知識社區(qū)和知識網(wǎng)絡,使民族學科研用戶實現(xiàn)無阻礙的知識共享和學術交流,個性化信息組織是門戶的基礎。目前建立的各個聚合了不同內容的門戶構件,可使民族學學科信息門戶實現(xiàn)個性化和可定制地呈現(xiàn)網(wǎng)頁內容。同時基于Web2.0開發(fā)的學科門戶也有較為成熟的設計,可作為民族學學科信息門戶的借鑒。Web2.0的開發(fā)其核心理念就是“個性化”,強調用戶的體驗和集體參與;Web2.0技術最本質的特征是互動性,即通過使用互動技術,使每個人都成為信息的提供者,并通過動態(tài)方式將信息組織起來,使信息有序化。信息資源組織的過程也是圍繞著更深層次上揭示人類知識的整體和關聯(lián)而不斷進行創(chuàng)新的過程。民族學學科信息門戶個性化的信息資源組織,就是借助民族學 [1] [2] 下一頁 精品源自作文園地 精品源自作文園地學科信息門戶,通過對民族科研用戶的反饋信息處理,動態(tài)地調整用戶個人數(shù)據(jù)庫,根據(jù)用戶的個性信息需求,來組織和開發(fā)信息資源。個性化信息資源組織即個性化知識挖掘。個性化知識挖掘是通過門戶系統(tǒng)、依據(jù)知識挖掘技術自動處理用戶數(shù)據(jù)庫中大量的原始數(shù)據(jù),從中挖掘、抽取出必然、有價值的知識元。這些知識元可以是用戶定義要發(fā)現(xiàn)的、也可以是用戶需求表現(xiàn)出來的,然后系統(tǒng)對這些知識元進行關聯(lián)、對比、評價,形成知識庫,將隱性知識顯性化以提供用戶利用。個性化信息資源的知識挖掘是信息組織的發(fā)展趨勢,也是對民族學學科信息門戶資源組織的必然要求。 民族學學科信息門戶資源組織方式的實現(xiàn),還需依賴很多條件。需借助民族學科信息門戶的技術條件、門戶平臺的資源整合功能、平臺的建設資金和門戶后續(xù)維護,所以門戶網(wǎng)站需要有一個實力雄厚的組建組織進行建設,在實際建設中,應由國家一級機構(中國社會科學院或國家民委等)聯(lián)合各民族機構以及各圖書館,采用成員館的管理形式進行管理,才能確保資金、資源和后續(xù)維護。這樣才能保證民族學學科信息門戶資源組織功能得以實現(xiàn),使其資源得到有效利用。上一頁 [1] [2] 精品源自作文園地
|