民族學(xué)學(xué)科信息門戶的資源組織的實現(xiàn)方式探析
精品源自作文園地 學(xué)科信息門戶(Subject Information Gateway, SIG)是指把某學(xué)科(專題)網(wǎng)絡(luò)資源、工具與服務(wù)進(jìn)行整合,并在一個可定制個性化服務(wù)的界面,為用戶提供一個同一協(xié)作的學(xué)術(shù)交流環(huán)境。在國外,這種組織模式幾乎覆蓋了所有的學(xué)科。中國學(xué)科信息門戶研究與建設(shè)始于2001年,從涵蓋的學(xué)科來看,主要涉及自然科學(xué)的基礎(chǔ)學(xué)科和應(yīng)用學(xué)科,而有關(guān)社會科學(xué)的學(xué)科門類卻很少。目前中國國家數(shù)字圖書館等多家單位建設(shè)了民族文化和研究數(shù)據(jù)庫50多個,在因特網(wǎng)上還有大量的介紹一個或多個民族文化和民族研究信息的網(wǎng)站以及一些商用數(shù)據(jù)庫中也有大量的民族研究資料。這些數(shù)據(jù)庫、網(wǎng)站由于是使用不同的硬件系統(tǒng)、平臺與軟件建設(shè),致使:一是用戶在使用這些數(shù)據(jù)庫時,面臨著各種規(guī)模的數(shù)據(jù)庫、多媒體和分布式體系結(jié)構(gòu)的選擇。檢索過程中的權(quán)限要求與IP驗證,檢索結(jié)果中出現(xiàn)的死鏈、大量無用或重復(fù)信息等障礙,使民族科研用戶難以在一個集成化信息檢索平臺上一站式獲取和處理自己所需信息。二是這些數(shù)據(jù)庫與數(shù)據(jù)庫之間、網(wǎng)站與網(wǎng)站之間沒有互聯(lián)互通,無法進(jìn)行資源共享和綜合利用,實際上形成了一個個信息孤島。 欲解決這些問題就需要把民族研究數(shù)據(jù)庫以及民族網(wǎng)站信息資源進(jìn)行集成化,以利于廣泛的利用。而民族學(xué)學(xué)科信息門戶的資源集成正是學(xué)科專家和專業(yè)館員利用門戶重新組織網(wǎng)絡(luò)上的本學(xué)科信息,對這些資源進(jìn)行詳細(xì)的元數(shù)據(jù)描述并提供指向資源的鏈接,可以說民族學(xué)學(xué)科信息門戶的資源組織是民族學(xué)數(shù)字信息集成的最好實現(xiàn)形式。本文試對民族學(xué)學(xué)科信息門戶的資源組織的實現(xiàn)方式作一分析。 一、構(gòu)建合理的民族學(xué)學(xué)科信息資源分類體系 分類體系既是對民族學(xué)學(xué)科信息門戶收集的資源實施組織,也是便于用戶基于學(xué)科分類進(jìn)行資源瀏覽與檢索的有效途徑。從國內(nèi)外已建設(shè)的學(xué)科信息門戶看,大型的學(xué)科信息門戶網(wǎng)站都通過使用合理的分類體系和詞表提供高質(zhì)量的服務(wù)。國外用于組織資源的分類法有DDC、UDC、LCC、EI、NLM以及自編的分類類目;國內(nèi)使用的分類法有《中圖法》、《科圖法》、DDC以及參照相關(guān)的國際標(biāo)準(zhǔn)建立的分類體系。對于民族學(xué)學(xué)科門戶資源組織的分類類目的設(shè)定,使用國內(nèi)的分類法設(shè)置較為合理,且《中圖法》的使用有廣泛的基礎(chǔ)。但直接把《中圖法》的民族學(xué)類目作為學(xué)科信息門戶的類目,又不利于資源組織。在《中圖法》中,總論民族學(xué)的類目設(shè)置在“社會科學(xué)總論”大類下,其他專論各民族的有關(guān)學(xué)科均入相關(guān)學(xué)科類,作為信息門戶資源組織的學(xué)科分類需要對類目進(jìn)行調(diào)整。根據(jù)《中圖法》的列類原則、參考教育部《學(xué)科分類與代碼》(GB/T13745-92),結(jié)合民族學(xué)的學(xué)科發(fā)展和研究文獻(xiàn)的分布、數(shù)據(jù)庫建設(shè)的種類,并考慮用戶的使用習(xí)慣,把民族學(xué)分成下列類目: 在二級類目下再根據(jù)信息量的多少細(xì)分,這樣就形成一個10個大類、50幾個二級類目和若干小類的類目體系。 二、構(gòu)建民族學(xué)學(xué)科敘詞表 受控詞表的運用既可以保證資源描述的準(zhǔn)確性,又利于實現(xiàn)本學(xué)科或?qū)n}的深入檢索。國內(nèi)外大部份學(xué)科信息門戶大都使用了受控詞表來描述資源,也有的用自編詞表。民族學(xué)領(lǐng)域目前沒有專門的受控詞表。就我國的學(xué)科信息門戶建設(shè)而言,把《中國分類主題詞表》 (以下簡稱《中分表》)作為受控詞表有較高的參考價值。但由于《中分表》是面向所有學(xué)科使用的,直接用于民族學(xué)學(xué)科信息門戶的資源組織有一定的困難。需要采取:一是要增設(shè)民族學(xué)科主題詞。大量的民族學(xué)學(xué)科主題詞,在《中分表》中沒有體現(xiàn)。例如,在《中分表》中有侗族的“侗戲”主題詞,無侗族的“侗族大歌”主題詞,侗族大歌和侗戲都是侗民族喜聞樂見的藝術(shù)形式,但侗族大歌更有影響力;再如,“口承文化”是無文字民族甚至是有文字民族傳承文化的一種形式,《中分表》缺少這樣的主題詞。在進(jìn)行資源組織時需增設(shè)民族學(xué)學(xué)科主題詞。二是不斷添加民族學(xué)新詞匯!吨蟹直怼纷鳛橐环N先組式和后組式語言兼容的分類主題一體化詞表,是不能隨時插入學(xué)科主題詞的,且《中分表》修訂周期過長,詞匯更新滯后。學(xué)科發(fā)展又在不斷增加新的詞匯,在民族研究領(lǐng)域就出現(xiàn)了大量的學(xué)科新詞,諸如非物質(zhì)文化遺產(chǎn)、游牧文化、無字文化、文化植被、瀕危語言、虛擬博物館等。對于“非物質(zhì)文化遺產(chǎn)”這類的詞,可以說是民族學(xué)研究領(lǐng)域的高頻詞,在《中分表》中就沒有體現(xiàn)。學(xué)科信息門戶是一個學(xué)科信息的集成平臺,信息門戶資源組織需要及時增加本學(xué)科領(lǐng)域的新詞匯,反映學(xué)科研究動態(tài)。所以在民族學(xué)學(xué)科信息門戶建設(shè)中需組織本領(lǐng)域的專家以《中分表》為基表,從中抽取所有有關(guān)民族學(xué)以及相關(guān)學(xué)科的詞匯;增補(bǔ)民族學(xué)領(lǐng)域中專業(yè)詞匯和學(xué)科新詞;增加自然語言的檢索詞,增大檢索入口,使用相關(guān)和參照關(guān)系等體現(xiàn)主題詞與自然語言檢索詞,編制《民族學(xué)學(xué)科敘詞表》作為受控詞表,以實現(xiàn)本專業(yè)的深入檢索。同時要關(guān)注和引入本體論等語義相關(guān)技術(shù),構(gòu)建民族學(xué)領(lǐng)域本體,更好地解決門戶間的互操作、知識整合、個性化服務(wù)等問題。 三、創(chuàng)建民族學(xué)領(lǐng)域本體 為適應(yīng)門戶的發(fā)展,多層次、多功能地表現(xiàn)民族學(xué)概念之間的關(guān)系,便于用戶進(jìn)行聯(lián)想和可視化檢索,使民族信息資源能夠在用戶與用戶之間以及各種異構(gòu)系統(tǒng)之間進(jìn)行廣泛的交流與知識共享,可利用民族敘詞表和本體(Ontology)在表達(dá)知識概念結(jié)構(gòu)上的關(guān)系,創(chuàng)建民族學(xué)領(lǐng)域本體。目前在國際上已有通用的本體描述語言,如W3C工作組于2004年正式推薦的標(biāo)準(zhǔn)網(wǎng)絡(luò)本體描述語言(Web Ontology Language,簡稱OWL);有實現(xiàn)本體構(gòu)建的工具WebODE、Prote' ge'、Ontosaurus等以及構(gòu)建本體的方法;有本體運用于藝術(shù)和農(nóng)業(yè)信息系統(tǒng)的范例,這些對民族學(xué)本體構(gòu)建均有借鑒意義。民族學(xué)領(lǐng)域本體的構(gòu)建是需要實現(xiàn)民族學(xué)領(lǐng)域的敘詞表到知識本體進(jìn)行轉(zhuǎn)化的過程,但其轉(zhuǎn)換不是一個直接的大規(guī)模詞表轉(zhuǎn)換,而是需要把一個領(lǐng)域分成若干的概念類,逐個類目的建立。例如,以流傳于甘、青、寧、新部分地區(qū)獨特的民間藝術(shù)“花兒”為例。使用本體構(gòu)建工具,建立概念(類):“花兒”概念,其下位類為“河州型花兒”、“洮岷型花兒”;建立屬性,且是每一個下位類都具有的屬性。使用“句”、“令(曲調(diào))”、“襯詞”;然后分別建立實例;同時還需設(shè)置等同與相關(guān)關(guān)系,因“花兒”民歌涉及民間詩學(xué)、民間音樂、民俗學(xué)、社會學(xué)、語言學(xué)、歷史學(xué)、民族學(xué)、人類學(xué),所以可使用“別類”,把上述概念進(jìn)行相關(guān)關(guān)系的顯示。這樣在語義系統(tǒng)中就構(gòu)成了一個可視的“花兒”概念(類)完整意義的本體。 民族學(xué)本體的構(gòu)建是一個系統(tǒng)工程,涉及民族學(xué)領(lǐng)域?qū)<覍Ρ绢I(lǐng)域知識概念及概念詞之間關(guān)系的確定、信息管理人員對知識概念的組織和計算機(jī)軟件工程人員在本領(lǐng)域內(nèi)的開發(fā),這里只是作一個引子,以期引起民族學(xué)學(xué)科信息門戶建設(shè)者的關(guān)注。 四、把元數(shù)據(jù)描述作為基本方法 要使民族學(xué)信息資源實現(xiàn)科學(xué)的知識組織,在提供民族學(xué)學(xué)科信息的檢索、瀏覽、鏈接的方便性和相關(guān)性的同時,保證其個性化信息服務(wù)得以充分體現(xiàn)。需通過元數(shù)據(jù)描述以下方式實現(xiàn)。 元數(shù)據(jù)是描述、組織和發(fā)現(xiàn)因特網(wǎng)上信息資源的有效工具,它通過描述數(shù)據(jù)的內(nèi)容和本質(zhì)特征,存儲相應(yīng)的檢索路徑,便于識別資源、評價資源,追蹤資源在使用過程中的變化,實現(xiàn)簡單高效地管理大量網(wǎng)絡(luò)化數(shù)據(jù),實現(xiàn)信息資源的有效發(fā)現(xiàn)、查找、一體化組織和對使用資源的有效管理。元數(shù)據(jù)作為學(xué)科信息門戶的基本信息組織方法,是每一個學(xué)科信息門戶建設(shè)中都須面臨的選擇。目前國際上很多門戶使用通用簡單的DC(都柏林核心元數(shù)據(jù))。我國多家單位在民族學(xué)數(shù)字資源建設(shè)中使用的元數(shù)據(jù)標(biāo)準(zhǔn)有很多,其中電子圖書、期刊論文、會議文獻(xiàn)、學(xué)位論文、地方志等數(shù)據(jù)庫絕大部分是等同采用國家科技部科技基礎(chǔ)平臺工作重點項目《我國數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)》子項目《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范》,但對視頻、音頻、照片等類型的數(shù)字資源組織,采用了不同的元數(shù)據(jù)標(biāo)準(zhǔn)。要建立民族學(xué)學(xué)科信息門戶首要的是選擇合適的通用的標(biāo)準(zhǔn)元數(shù)據(jù)格式,民族學(xué)學(xué)科信息門戶的元數(shù)據(jù)可以參照《專門數(shù)字對象描述元數(shù)據(jù)規(guī)范》,作為基本的元數(shù)據(jù)。但在視頻、音頻標(biāo)準(zhǔn)上,需要選擇符合民族學(xué)學(xué)科信息的元數(shù)據(jù)。例如,在責(zé)任主體元數(shù)據(jù)項,須增加少數(shù)民族文化傳承方式的“口述”、“傳承”等元數(shù)據(jù)元素。同時在民族學(xué)學(xué)科信息門戶中要建立包含元數(shù)據(jù)以及實現(xiàn)門戶元數(shù)據(jù)格式的轉(zhuǎn)換和網(wǎng)絡(luò)中不同元數(shù)據(jù)的互操作的功能庫。只有這樣,才能保證民族信息在不同結(jié)構(gòu)的信息源中傳輸不失真。 五、要注重民族學(xué)學(xué)科的個性化信息資源的知識挖掘 在國外,門戶建設(shè)已有十幾年的歷史,門戶已趨于成熟,為各自的學(xué)科發(fā)揮著重要的作用。國內(nèi)學(xué)科信息門戶建設(shè)近幾年發(fā)展也很快,但建設(shè)的門戶普遍存在資源的可用性和易用性差。多數(shù)門戶是封閉的,無法實現(xiàn)用戶的交互性和用戶資源的共享,門戶資源利用率低。而用戶呼喚門戶朝“5C化”發(fā)展,即用戶化(Customization),適應(yīng)不同用戶對信息獲取的不同需求和興趣;商業(yè)化(Commerce),為用戶提供商務(wù)方面的服務(wù);溝通化(Communication),用電子郵件,網(wǎng)上會議等通訊工具在網(wǎng)站和用戶之間、用戶與用戶之間架起信息溝通的橋梁;社區(qū)化(Community),為用戶提供彼此可以互相交流,互相學(xué)習(xí)和互相幫助的虛擬空間;兼容化(Compatibility),即能夠讓一個虛擬圖書館系統(tǒng)和使用不同平臺的相關(guān)技術(shù)和服務(wù)實現(xiàn)無縫對接,為用戶創(chuàng)造一個完整、友好的界面。用戶的需求是門戶建設(shè)的源動力,也促使民族學(xué)學(xué)科信息門戶建設(shè)者思考其門戶資源的組織模式,以適應(yīng)民族學(xué)學(xué)科信息門戶快速發(fā)展。 民族學(xué)學(xué)科信息門戶建立的最終目的是通過建立知識社區(qū)和知識網(wǎng)絡(luò),使民族學(xué)科研用戶實現(xiàn)無阻礙的知識共享和學(xué)術(shù)交流,個性化信息組織是門戶的基礎(chǔ)。目前建立的各個聚合了不同內(nèi)容的門戶構(gòu)件,可使民族學(xué)學(xué)科信息門戶實現(xiàn)個性化和可定制地呈現(xiàn)網(wǎng)頁內(nèi)容。同時基于Web2.0開發(fā)的學(xué)科門戶也有較為成熟的設(shè)計,可作為民族學(xué)學(xué)科信息門戶的借鑒。Web2.0的開發(fā)其核心理念就是“個性化”,強(qiáng)調(diào)用戶的體驗和集體參與;Web2.0技術(shù)最本質(zhì)的特征是互動性,即通過使用互動技術(shù),使每個人都成為信息的提供者,并通過動態(tài)方式將信息組織起來,使信息有序化。信息資源組織的過程也是圍繞著更深層次上揭示人類知識的整體和關(guān)聯(lián)而不斷進(jìn)行創(chuàng)新的過程。民族學(xué)學(xué)科信息門戶個性化的信息資源組織,就是借助民族學(xué) [1] [2] 下一頁 精品源自作文園地 精品源自作文園地學(xué)科信息門戶,通過對民族科研用戶的反饋信息處理,動態(tài)地調(diào)整用戶個人數(shù)據(jù)庫,根據(jù)用戶的個性信息需求,來組織和開發(fā)信息資源。個性化信息資源組織即個性化知識挖掘。個性化知識挖掘是通過門戶系統(tǒng)、依據(jù)知識挖掘技術(shù)自動處理用戶數(shù)據(jù)庫中大量的原始數(shù)據(jù),從中挖掘、抽取出必然、有價值的知識元。這些知識元可以是用戶定義要發(fā)現(xiàn)的、也可以是用戶需求表現(xiàn)出來的,然后系統(tǒng)對這些知識元進(jìn)行關(guān)聯(lián)、對比、評價,形成知識庫,將隱性知識顯性化以提供用戶利用。個性化信息資源的知識挖掘是信息組織的發(fā)展趨勢,也是對民族學(xué)學(xué)科信息門戶資源組織的必然要求。 民族學(xué)學(xué)科信息門戶資源組織方式的實現(xiàn),還需依賴很多條件。需借助民族學(xué)科信息門戶的技術(shù)條件、門戶平臺的資源整合功能、平臺的建設(shè)資金和門戶后續(xù)維護(hù),所以門戶網(wǎng)站需要有一個實力雄厚的組建組織進(jìn)行建設(shè),在實際建設(shè)中,應(yīng)由國家一級機(jī)構(gòu)(中國社會科學(xué)院或國家民委等)聯(lián)合各民族機(jī)構(gòu)以及各圖書館,采用成員館的管理形式進(jìn)行管理,才能確保資金、資源和后續(xù)維護(hù)。這樣才能保證民族學(xué)學(xué)科信息門戶資源組織功能得以實現(xiàn),使其資源得到有效利用。上一頁 [1] [2] 精品源自作文園地
|