注意:網(wǎng)站查詢并不一定完全準(zhǔn)確,使用請先核實(shí)!
畢業(yè)論文查詢
請選擇:
請輸入關(guān)鍵字:
基于XML的三個常用元數(shù)據(jù)描述工具的評價與比較
基于XML的三個常用元數(shù)據(jù)描述工具的評價與比較 【內(nèi)容提要】隨著Internet和WWW的飛速發(fā)展,XML憑借其自身的特點(diǎn),為網(wǎng)絡(luò)信息的管理、搜索以及Web上各種應(yīng)用的鏈接提供了極大的便利,從而得到了廣泛應(yīng)用。XML的一個重要特點(diǎn)就是允許用戶定義自己的標(biāo)簽,從而實(shí)現(xiàn)對信息的存儲和管理。XML中較常用的標(biāo)簽定義工具有DTD和XML Schema,而RDF是一個專用的元數(shù)據(jù)描述框架。本文結(jié)合一個MARC元數(shù)據(jù)描述的實(shí)例,對這三個工具進(jìn)行了比較細(xì)致的分析和對比,并對未…… 1 引言 XML是繼HTML之后的又一種WEB標(biāo)記語言,它為用戶提供了靈活的標(biāo)記擴(kuò)展機(jī)制,使得不同內(nèi)容的資源能以格式良好的自定義的標(biāo)記元素來表現(xiàn)。元數(shù)據(jù)是描述信息資源或數(shù)據(jù)等對象的數(shù)據(jù),主要用來識別、評價、追蹤資源,以及方便對資源的管理、發(fā)現(xiàn)、查找和交換。隨著計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,特別是Internet的普及,網(wǎng)絡(luò)環(huán)境下信息的描述和處理成為一個重要的問題,相應(yīng)地網(wǎng)絡(luò)環(huán)境下的元數(shù)據(jù)問題也成為一個研究的熱點(diǎn)。DTD和XML Schema是XML中常用的進(jìn)行標(biāo)記擴(kuò)展的工具,RDF是專用的元數(shù)據(jù)描述工具,網(wǎng)絡(luò)環(huán)境下的元數(shù)據(jù)描述通常就是借助這幾個工具,利用XML的標(biāo)記可擴(kuò)展性來完成。在這三個工具中,DTD隨著XML1.0最早被提出,伴隨著XML應(yīng)用的普及和人們對DTD認(rèn)識的加深,又進(jìn)一步提出了RDF和更有發(fā)展?jié)摿Φ腦ML Schema。 2 DTD DTD作為XML1.0規(guī)范的重要組成部分,它使用EBNF(Extended Backus Naur Form)語法完成XML文檔結(jié)構(gòu)的定義,即XML文檔中標(biāo)記的定義。一個XML文檔只能對應(yīng)一個DTD,一個DTD由一系列標(biāo)記定義組成,包括元素定義(element declaration)、屬性定義(attribate declaration)、實(shí)體定義(entity declaration)、注釋定義(notation declaration),是目前支持和應(yīng)用最廣泛的一種標(biāo)記擴(kuò)展工具。例如,一個用于描述MARC元數(shù)據(jù)的XML文檔的DTD可以定義如下: 。!DOCTYPE mare [ <!ELEMENT marc (record) *> <!ATTLIST mare TYPE (CN |US| UN11) # REQUIRED> <!ELEMENT record (datafield) *> 。!ATTLIST record type CDATA # REQURED info CDATA # REQUIRED> 。!ELEMENT,datafield (subdatafield) *> 。!ATTLIST datafield tag CDATA # REQUIRED ind1 CDATA # IMPLIED ind2 CDATA # IMPLIED> 。!ELEMENT subdatafield (# PCDATA)> 。迹TTLIST subfield code CDATA # REQUIRED> ]> 上例中各個標(biāo)記和屬性的作用如下: 。糓ARC>:用于標(biāo)記內(nèi)容的開始和結(jié)束,屬性“type”用于標(biāo)記MARC類型,如CNMARC,USMARC,UNIMARC。 。糝ECORD>:用于標(biāo)記MARC記錄的24byte定長頭標(biāo)區(qū),屬性有“type”和“info”。 <DATAFIELD>:MARC記錄數(shù)據(jù)字段區(qū)的數(shù)據(jù)字段標(biāo)記,對應(yīng)MARC記錄中每個字段的內(nèi)容,屬性“tag”、“ind1”和“ind2”分別代表字段標(biāo)識、第一和第二指示符。 。糞UBDATAFIELD>:MARC記錄數(shù)據(jù)字段區(qū)中數(shù)據(jù)字段的子字段標(biāo)記,屬性“code”為子字段標(biāo)識。 通過該例,我們可以看到DTD較好地完成了XML的標(biāo)記擴(kuò)展(即元數(shù)據(jù)描述)的任務(wù),目前在Internet上已有大量使用DTD描述的元數(shù)據(jù)存在。但是DTD提出較早,人們在使用過程中也發(fā)現(xiàn)它有很多的不足之處。其主要特點(diǎn)如下: 、匐y以理解和書寫。由于采用的是不同于XML的名為EBNF的語法,因?yàn)樾枰攘私釫BNF,這對于人們的閱讀和書寫都帶來了困難。 、陔y以使用程序進(jìn)行元數(shù)據(jù)的自動處理。由于使用EBNF語法,這給DTD的自動處理也帶來了麻煩。通常情況下,我們需要對DTD進(jìn)行驗(yàn)證,這時使用DOM就不可能對使用EBNF語法書寫的DTD進(jìn)行分析,而必須使用專門的分析程序進(jìn)行分析驗(yàn)證。 ③DTD不支持?jǐn)?shù)據(jù)類型。DTD只支持包括文檔類型在內(nèi)的少數(shù)幾種數(shù)據(jù)類型,這意味著在實(shí)際使用過程中經(jīng)常需要進(jìn)行類型的轉(zhuǎn)換才能達(dá)到預(yù)想的效果。 ④DTD不支持Namespaces。由于必須把所有的元數(shù)據(jù)放在一個DTD文件中,如果需要對已有的DTD進(jìn)行擴(kuò)充則只能在原文件的基礎(chǔ)上進(jìn)行重寫,這對于元數(shù)據(jù)的維護(hù)和擴(kuò)充都十分不方便。 總之,DTD在簡單的文檔結(jié)構(gòu)定義方面是較出色的,如果考慮到XML,是源自同樣使用DTD的SGML的話,理解在XML1.0中選擇了DTD就不難了。但如果我們考慮到XML的用途現(xiàn)在已不僅局限于文檔處理,那么DTD的這些缺點(diǎn)就變得日趨嚴(yán)重。因此W3C(World Wide Web Consortium)在看到了DTD的諸多問題之后,提出了一系列用來代替DTD的建議(Recommendation,即正式標(biāo)準(zhǔn)),包括RDF、XML-Data、DCD、XML Schema等,其中以RDF和XML Schema的影響較大. 3 RDF RDF是W3C在1999年2月頒布的一個關(guān)于元數(shù)據(jù)的建議,它主要解決如何采用XML標(biāo)準(zhǔn)語法無二義性地描述資源對象的問題,使得所描述資源的元數(shù)據(jù)信息成為機(jī)器可理解的信息。RDF不僅可以象DTD一樣允許設(shè)計(jì)者定義對象,并可以加入屬性以對對象進(jìn)行描述和定義,還可以作出有關(guān)對象的復(fù)雜的陳述,例如申明資源之間的關(guān)系等。RDF的基本對象類型有:資源(Resources)、屬性(Properties)、陳述(Statements)。每一個資源都有屬性,每個資源通過唯一資源標(biāo)識符URI來標(biāo)識,它的屬性由屬性類型來作標(biāo)識,每一個屬性類型都有對應(yīng)的屬性值。屬性類型表示出這些屬性值與資源之間的關(guān)系。在RDF中,屬性值要么是一些被認(rèn)為具有原子性的事物(如字符中或數(shù)字符),要么是其他的資源,而這些資源本身又擁有自身的屬性。所有指向同一資源的陳述的集合就是描述。以前面所描述的MARC元數(shù)據(jù)為例,使用RDF可以定義如下: <?xml version=‘1.0’?> 。紃df:RDF xmlns:rdf=“httP://www.w3.org/1999/02/22 rdf—syntax—ns#” xmlns:rdfs=“http://=www.w3.org/TR/1999/ PR—rdf—schema—19990303#” xmlns:dc=“http://purl.org/dc#” xmlns:marc=“http://libsys2000.nju.edu.cn/marc #”> 。紃df:Description ID=“MARCTYPE”> 。紃df:type rdf:resource=“http://www.w3.org/ 1999/02/22—rdf—syntax—ns#Property”/> <rdfs:label>MARCTYPE</rdfs:label> 。紃dfs:is DefinedBY rdf:resource=“”/> </rdf:Description> 。紃df:Description ID=“RECORD”> <rdf:type rdf:resource=“http://www.w3.org/ 1999/02/22—rdf—syntax—ns # Property”/> 。糵dfs:label>RECORD</rdfs:label> <rdfs:isDefinedBy rdf:resource=“”/> 。/rdf:Description> <rdf:Description ID=“DATAFIELD”> <rdf:type rdf:resource=“http://www.w3.org/ 1999/02/22—rdf—syntax—ns # Property”/> 。紃dfs:label>DATAFIELD</rdfs:label> <rdfs:isDefinedBy rdf:resource=“”/> 。/rdf:Description> 。紃ad:Description ID=“DATAFIELD”> 。紃df:type rdf:resource=“http://www.w3.org/ 1999/02/22—rdf—syntax—ns # Property”/> 。紃dfs:label>SUBDATAFIELD</rdfs:labcl> <rdfs:is DefinedBy rdf:resource=“”/> 。/rdf:Description> 通過上例,我們可以看到針對DTD種種不足而提出的RDF建議克服了DTD的主要缺點(diǎn),具有以下幾個優(yōu)點(diǎn): 、僖卓刂菩。由于RDF使用簡單的資源——屬性——值三元組,所以很容易控制,即使是數(shù)量很大的時候。 ②包容性。在RDF這種元數(shù)據(jù)模型中既可以定義自己的詞匯集,也可以嵌入DC元數(shù)據(jù)或別的類型的元數(shù)據(jù)。 、劭山粨Q性。由于XML是目前最具發(fā)展前景的標(biāo)記語言,使用XML作為描述語法的RDF在未來也就可以成為一種可以攜帶多種元數(shù)據(jù)來往于網(wǎng)絡(luò)上的框架工具。 、芤拙C合性。在RDF中資源的屬性是資源,屬性值以及關(guān)于資源的陳述也可以是資源,都可以用RDF進(jìn)行描述,這樣可以很容易地將多個描述綜合,以達(dá)到發(fā)現(xiàn)知識的目的。 總之,RDF是一個公認(rèn)的極佳的強(qiáng)有力的元數(shù)據(jù)描述工具,這也部分地實(shí)現(xiàn)了它結(jié)束在元數(shù)據(jù)描述領(lǐng)域一切努力的雄心。但是,RDF的這種強(qiáng)有力也導(dǎo)致了它嚴(yán)重的缺陷,就是在一些日常應(yīng)用中顯得太復(fù)雜了,設(shè)計(jì)者不僅需要定義對象和屬性,而且需要定義復(fù)雜的陳述。一個復(fù)雜的標(biāo)準(zhǔn)是很難在短時間內(nèi)被廣大網(wǎng)絡(luò)應(yīng)用開發(fā)人員接受、掌握和應(yīng)用的,因此這個復(fù)雜的標(biāo)準(zhǔn)也就很難在網(wǎng)絡(luò)上推廣和被接受。就象復(fù)雜的SGML很少有人使用,而對其進(jìn)行簡化后形成的XML則迅速被接受一樣,RDF在網(wǎng)絡(luò)上尤其是Internet上是很難有市場的,而只會在一些特定的領(lǐng)域得到應(yīng)用。Internet上的元數(shù)據(jù)描述需要的應(yīng)該是一種簡單而且可靠的解決方案。 4 XML Schema Schema是一種描述信息結(jié)構(gòu)的模型,它是借用數(shù)據(jù)庫中一種描述相關(guān)表格內(nèi)容的機(jī)制,為一類文件建立一個模式。從這一層意義上講,DTD實(shí)際上也是一種Schema,只不過這種Schema使用了古怪的EBNF語法,因而帶來了諸多的不便。RDF Schema可能是由于RDF的原因,W3C最終只推出了RDF Schema的草案,一直未能更進(jìn)一步推出正式的建議(即標(biāo)準(zhǔn))。XML Schema是2001年5月由W3C推薦的用于描述XML文件結(jié)構(gòu)的一個框架,它的語法與XML相同,但Schema文件所描述的是引用它的XML文件中的元素和屬性的具體類型。以前面所描述的MARC元數(shù)據(jù)定義為例,使用XML Schema可以定義如下: 。紉sd:schema xmlns:xsd=“http://www.w3.org/2001/ XMLSchema”> 。紉sd:element name=“mare”type=“marc”/> 。紉sd:complexType name=“marc”> 。紉sd:sequence> <xsd:element name=“recurd” minOccurs=“0” maxOccurs=“unbounded”> 。紉sd:complexType> <xsd:sequence> 。紉sd:element name=“datafield” type=“datafield”minOccurs= “0” maxOccurs=“unbounded” /> 。/xsd:sequence> 。紉sd:attribute name=“rectype” type=“xsd:string”/> 。紉sd:attribute name=“recinfo” type=“xsd: string”/> 。/xsd:complexType> 。/xsd:element> 。/xsd:sequence> 。紉sd:attribute name=“marctype” type= “xsd: string”/> 。/xsd:complexType> 。紉sd:complexType name=“datafield”> 。紉sd:sequence> 。紉sd:element name=“subdatafield”type=‘xsd: string”minOccurs=“0”maxOccurs=“unbounded”content =“textOnly”> <xds:attribute name=“code” type=“xsd: string”/> 。/xsd:element> 。/xsd:sequence> <xsd:attribute name=“tag” type=“xsd:string”/> 。紉sd:attribute name=“ind1”type=“xsd:string”/> <xsd:attribute name=“ind2”type=“xsd:string”/> </xsd:complexType> 。/xsd:schema> 通過上例,我們可以看到XML Schema本身就是一個XML文件,但不同的是,Schema文件所描述的是引用它的XML文件中的元素和屬性的具體類型。相比DTD,XML Schema具有以下優(yōu)點(diǎn): 、僖恢滦。Schema使得對XML的定義不必再利用一種特定的形式化的語言,而是直接借助XML自身的特性,利用XML的基本語法規(guī)則采定義XML文檔的結(jié)構(gòu),使得XML達(dá)到了從內(nèi)到外的完美統(tǒng)一,也為XML的進(jìn)一步發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。 、跀U(kuò)展性。Schema對DTD進(jìn)行了擴(kuò)充,引入了數(shù)據(jù)類型、命名空間,從而使其具備較強(qiáng)的可擴(kuò)展性。 、刍Q性。利用Schema,我們能夠書寫XML文檔以及驗(yàn)證文檔的合法性。另外,通過特定的映射機(jī)制,還可以將不同的Schema進(jìn)行轉(zhuǎn)換,以實(shí)現(xiàn)更高層次的數(shù)據(jù)交換。 ④規(guī)范性。同DTD一樣,XML Schema也提供了一套完整的機(jī)制以約束XML文檔中置標(biāo)的使用,但相比之下,后者基于XML,更具有規(guī)范性。Schema利用元素的內(nèi)容和屬性來定義XML文檔的整體結(jié)構(gòu),如哪些元素可以出現(xiàn)在文檔中、元素間的關(guān)系是什么、每個元素有哪些內(nèi)容和屬性、以及元素出現(xiàn)的順序和次數(shù)等等,都可一目了然。 5 綜述 田于XML Schema的種種優(yōu)點(diǎn),現(xiàn)在Schema取代DTD已成大勢所趨。在這種情況下,國際上一些知名企業(yè)和組織審時度勢紛紛在戰(zhàn)略上向XML Schema傾斜,提供對XML Schema的支持。其中最為典型的當(dāng)然要數(shù)微軟的BizTalk和xml.org組織的注冊/資源庫。更加值得一提的是:微軟在其瀏覽器軟件Internet Explorer 5.0中率先提供對Schema的支持。盡管微軟支持的Schema也只是過渡性“標(biāo)準(zhǔn)”,但今后肯定還會不斷修改。 雖然我們說XML Schema終將代替DTD,但在短期內(nèi)DTD還是有著它的優(yōu)勢的,例如廣泛的工具支持,廣泛的應(yīng)用經(jīng)驗(yàn)等。因此,短期內(nèi)DTD會與XML Schema共存,而RDF則會在一些需要它的強(qiáng)大的元數(shù)據(jù)描述能力的領(lǐng)域找到它的位置。 【參考文獻(xiàn)】 1 黃偉紅,張福炎.基于XML/RDF的MARC元數(shù)據(jù)描述技術(shù).情報學(xué)報,2000(4) 2 程變愛.試論資源描述框架(RDF).現(xiàn)代圖書情報技術(shù),2000(6) 3 XML Schema Part 0:Primer.http://www.w3.org/ TR/xmlschema—0/#4Q99html.xml 4 XML Schema Part 1:Structures.http://www.w3.org/ TR/xmlschema—1/ 5 XML Schema Part 2:Datatypes.http://www.w3.org/ TR/xmlschema—2/ 6 XML Schema Requirements.http://www.w3.org/TR/ NOTE—xml—schema—req 7 W3C Proposed Recommendation.Resource Description Framework (RDF) Schema Specification.http://www. w3.org/TR/PR—rdf—schema 8 W3C Proposed Recommendation,Resource Description Framework (RDF) Model and Syntax Specification. http://www.w3.org/TR/1999/PR—rdf—syntax—19990105 9 張敏,張曉林.元數(shù)據(jù)(Metadata)的發(fā)展和相關(guān)格式.四川圖書館學(xué)報,2000(2) 10 張偉,苑迎春,等.DTD與Schema簡介.現(xiàn)代電子技術(shù),2001(6)
|
 |
文章標(biāo)題 |
相關(guān)內(nèi)容 |
|
1
|
班主任工作的支點(diǎn)
|
班主任工作的支點(diǎn) 班主任工作不僅是在班集體中全面貫徹黨的教育方針,落實(shí)學(xué)校的規(guī)章制度,實(shí)施素質(zhì)教育,完成教學(xué)計(jì)劃,使學(xué)生在德、智、體、美等方面都得到全面發(fā)展;而且班主任是溝通學(xué)校、家庭、社會共同對學(xué)生進(jìn)行教育的主要支點(diǎn)。作為一名在鄉(xiāng)小學(xué)任教的班主任,應(yīng)做到以下幾點(diǎn)。....
|
詳細(xì)
|
2
|
讓每一個學(xué)生都有輝煌的明天
|
讓每一個學(xué)生都有輝煌的明天 我很欣賞一句話:教師的工作是托起明天的太陽。是啊,我們今天的一切工作,不就是為了每一個學(xué)生都能擁有一個輝煌的未來嗎?我們所做的一切,無非是為孩子未來的發(fā)展打下良好的基礎(chǔ),使他們具備再發(fā)展所必須....
|
詳細(xì)
|
3
|
班級管理和科學(xué)化
|
班級管理和科學(xué)化 今年6月,我送走了又一批初中畢業(yè)生;厥兹陙戆嘀魅喂ぷ,總結(jié)經(jīng)驗(yàn)和教訓(xùn),對于我今后的工作會有一定的啟示和指導(dǎo)作用。 一、把競爭的機(jī)制引入倒班級管理中來。
|
詳細(xì)
|
4
|
思想疏導(dǎo)--養(yǎng)成教育的重要環(huán)節(jié)
|
思想疏導(dǎo)--養(yǎng)成教育的重要環(huán)節(jié) 問題的提出: ⒈學(xué)生《行為規(guī)范》的養(yǎng)成教育是學(xué)校德育的基礎(chǔ)工程,是現(xiàn)代教育的重要內(nèi)容。養(yǎng)成教育過程必定伴隨系列思想活動,而思想活動的過程又以一定....
|
詳細(xì)
|
5
|
班級要大家共同管理
|
班級要大家共同管理 原載于《真源教育資源網(wǎng)》 著名的教育改革家魏書生曾這樣說過:“班級像一個大家庭,同學(xué)們?nèi)缧值芙忝冒慊ハ嚓P(guān)心著、幫助著,互相鼓舞著、照顧著....
|
詳細(xì)
|
6
|
淺談班級凝聚力的形成
|
淺談班級凝聚力的形成 江蘇省平潮高級中學(xué) 戴建萍 班集體作為學(xué)生成長過程中的一個重要組成部分,她是學(xué)生成長的搖藍(lán)。實(shí)踐證明,良好的班集體始終激勵著學(xué)生不斷進(jìn)....
|
詳細(xì)
|
7
|
班級管理中如何培養(yǎng)創(chuàng)造性個性
|
班級管理中如何培養(yǎng)創(chuàng)造性個性 所謂創(chuàng)造性個性品質(zhì)主要是指具有創(chuàng)造的意向、創(chuàng)造的情感、創(chuàng)造的意志和創(chuàng)造的性格等獨(dú)特的心理品質(zhì)。它包括自信、勇敢、獨(dú)立性強(qiáng)、有恒心、一絲不茍等良好的人格特征。如何在班級管理中培養(yǎng)學(xué)生創(chuàng)造性個性品質(zhì)呢?<....
|
詳細(xì)
|
8
|
關(guān)于班級軟管理
|
關(guān)于班級軟管理 現(xiàn)代教育大力提倡量化管理,對學(xué)生的學(xué)習(xí)表現(xiàn)進(jìn)行分值顯示。但在實(shí)踐中,我們往往會有這樣的體會,雖然學(xué)校制度、條例及與之相配套的檢查等這些硬管理手段很齊備,但僅僅作為被動管理,一旦有所松懈,便會亂作一團(tuán),且容易產(chǎn)生抵觸情緒。 &nbs....
|
詳細(xì)
|
9
|
“無為”管理藝術(shù)
|
“無為”管理藝術(shù) 教育學(xué)是研究教育現(xiàn)象及其規(guī)律的科學(xué)。教育現(xiàn)象是社會現(xiàn)象的組成部分,要深刻認(rèn)識教育現(xiàn)象,必須把它放到社會大背景之中,先見森林再見樹木。 高科技時代、信息時代、改革開放的時代,使人們的社會生活觀念、生活方式發(fā)生了廣泛、深刻的變化。 現(xiàn)代社會管理的發(fā)展趨....
|
詳細(xì)
|
10
|
談班級管理原則
|
談班級管理原則 在學(xué)校管理中,班級管理是一個重要方面。班級管理包括學(xué)校領(lǐng)導(dǎo)對班級的管理和班主任對班級的管理,還包括學(xué)生參與管理。其中,主要是班主任對班級的管理。班級管理原則對于建立和發(fā)展班級集體,全面實(shí)現(xiàn)班級目標(biāo)以及全面提高教育質(zhì)量....
|
詳細(xì)
|
5661條記錄 1/567頁 第頁 [首頁] [上頁] [下頁] [末頁] |