元數(shù)據(jù)標(biāo)準(zhǔn)研究亟待加強
從IT時代到DT時代,大數(shù)據(jù)已成為一場革命,正在改變?nèi)藗兊纳?、工作和思維方式。大數(shù)據(jù)標(biāo)準(zhǔn)研制作為產(chǎn)業(yè)發(fā)展基礎(chǔ),目前仍處于起步階段。為實現(xiàn)數(shù)據(jù)間無歧義溝通,元數(shù)據(jù)標(biāo)準(zhǔn)研究與應(yīng)用顯得更為迫切。
在研國標(biāo)有10項
大數(shù)據(jù)領(lǐng)域的標(biāo)準(zhǔn)化工作是支撐大數(shù)據(jù)產(chǎn)業(yè)發(fā)展和應(yīng)用的重要基礎(chǔ)。記者近日從全國信標(biāo)委大數(shù)據(jù)標(biāo)準(zhǔn)工作組第二次會議上獲悉,目前大數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)研制還處于起步階段。國際上有4大標(biāo)準(zhǔn)化組織針對大數(shù)據(jù)進(jìn)行專門研究,分別是ISO/IEC JTC1 SC32、ISO/IEC JTC1 WG9、ITU和NIST。
為了推動和規(guī)范我國大數(shù)據(jù)產(chǎn)業(yè)的快速發(fā)展,建立大數(shù)據(jù)的產(chǎn)業(yè)鏈,與國際標(biāo)準(zhǔn)接軌,我國在2014年12月正式成立了全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會大數(shù)據(jù)標(biāo)準(zhǔn)工作組(以下簡稱工作組)。工作組主要負(fù)責(zé)制定和完善我國大數(shù)據(jù)領(lǐng)域標(biāo)準(zhǔn)體系,組織開展大數(shù)據(jù)相關(guān)技術(shù)和標(biāo)準(zhǔn)的研究,申報國家、行業(yè)標(biāo)準(zhǔn),承擔(dān)國家、行業(yè)標(biāo)準(zhǔn)制修訂計劃任務(wù),宣傳、推廣標(biāo)準(zhǔn)實施,組織推動國際標(biāo)準(zhǔn)化活動。目前,工作組正在研制的國家標(biāo)準(zhǔn)有10項,其中《信息技術(shù)大數(shù)據(jù)術(shù)語》和《信息技術(shù)大數(shù)據(jù)技術(shù)參考模型》兩項國家標(biāo)準(zhǔn)已經(jīng)完成相應(yīng)的草案,準(zhǔn)備進(jìn)入征求意見階段。
“目前已有138家單位申請成為工作組成員?!敝袊娮蛹夹g(shù)標(biāo)準(zhǔn)化研究院副院長高林表示,“工作組下一步將繼續(xù)完善和維護(hù)工作組工作平臺,加強元數(shù)據(jù)、數(shù)據(jù)分類、數(shù)據(jù)開放共享等方面的標(biāo)準(zhǔn)化研究,同時將積極開展測試評價、認(rèn)證等相關(guān)準(zhǔn)備工作?!?/p>
值得一提的是,在研究提出大數(shù)據(jù)技術(shù)框架的基礎(chǔ)上,結(jié)合數(shù)據(jù)全周期管理,數(shù)據(jù)自身標(biāo)準(zhǔn)化特點,當(dāng)前各領(lǐng)域推動大數(shù)據(jù)應(yīng)用的初步實踐,以及未來大數(shù)據(jù)發(fā)展的趨勢,工作組提出了大數(shù)據(jù)標(biāo)準(zhǔn)體系框架。大數(shù)據(jù)標(biāo)準(zhǔn)體系由五個類別的標(biāo)準(zhǔn)組成,分別為:基礎(chǔ)標(biāo)準(zhǔn)、技術(shù)標(biāo)準(zhǔn)、產(chǎn)品和平臺標(biāo)準(zhǔn)、大數(shù)據(jù)安全標(biāo)準(zhǔn)及應(yīng)用和服務(wù)標(biāo)準(zhǔn)。
有專家認(rèn)為,針對大數(shù)據(jù),我國在數(shù)據(jù)管理、云計算、信息安全等方面,已經(jīng)發(fā)布和在研一些標(biāo)準(zhǔn),適用于大數(shù)據(jù)環(huán)境,提供了一定的基礎(chǔ),但是缺乏標(biāo)準(zhǔn)化整體規(guī)劃;數(shù)據(jù)分析、數(shù)據(jù)安全、數(shù)據(jù)質(zhì)量管理等技術(shù)標(biāo)準(zhǔn),數(shù)據(jù)處理平臺、開放數(shù)據(jù)集、數(shù)據(jù)服務(wù)平臺類新型產(chǎn)品和服務(wù)形態(tài)的標(biāo)準(zhǔn)較為缺乏,亟須研制。
需加強元數(shù)據(jù)標(biāo)準(zhǔn)研究
近年來,大數(shù)據(jù)技術(shù)已經(jīng)開始步入高速發(fā)展階段,國內(nèi)外從事大數(shù)據(jù)方面研究和服務(wù)的公司越來越多,行業(yè)分得越來越細(xì)。不過,在行業(yè)應(yīng)用中,由于缺乏統(tǒng)一的數(shù)據(jù)描述,數(shù)據(jù)在解釋、同步、轉(zhuǎn)換過程中時常會存在歧義,數(shù)據(jù)擁有者不能及時地按業(yè)務(wù)要求提供正確的數(shù)據(jù)時有發(fā)生。因此,在大數(shù)據(jù)時代,借助于元數(shù)據(jù)了解數(shù)據(jù)元素含義和上下文的需求越來越強烈。
記者了解到,ISO/IEC JTC1 SC32下設(shè)4個工作組研究不同領(lǐng)域的標(biāo)準(zhǔn)研制,其中就包括元數(shù)據(jù)。其范圍涉及研制開發(fā)和維護(hù)有利于規(guī)范和管理的元數(shù)據(jù)、元模型和本體的標(biāo)準(zhǔn),此類標(biāo)準(zhǔn)有助于理解和共享數(shù)據(jù)、信息和過程,支持互操作性,電子商務(wù)以及基于模型和基于服務(wù)的開發(fā),包括:建議用于規(guī)定和管理元數(shù)據(jù)、元模型和本體的框架;規(guī)定和管理元數(shù)據(jù)、元模型和本體;規(guī)定和管理過程、服務(wù)和行為數(shù)據(jù);開發(fā)管理元數(shù)據(jù)、元模型和本體的機制,包括注冊和存儲;開發(fā)交換元數(shù)據(jù)、元模型和本體的機制,包括基于互聯(lián)網(wǎng)、局域網(wǎng)等的語義。
對于我國元數(shù)據(jù)標(biāo)準(zhǔn)制定,有專家就指出,我國迫切需要加強元數(shù)據(jù)標(biāo)準(zhǔn)或元數(shù)據(jù)模型的研究與應(yīng)用,健全完善元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范及元數(shù)據(jù)模型。需要充分結(jié)合政府各部門現(xiàn)有數(shù)據(jù)資源建設(shè)情況,針對當(dāng)前政務(wù)大數(shù)據(jù)資源、科技大數(shù)據(jù)資源、電子商務(wù)大數(shù)據(jù)資源等重點領(lǐng)域,研制元數(shù)據(jù)標(biāo)準(zhǔn)或統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)模型框架,使得大數(shù)據(jù)向著標(biāo)準(zhǔn)化、條理化、脈絡(luò)化方向發(fā)展,實現(xiàn)無歧義溝通、理解和使用數(shù)據(jù)。解決當(dāng)前數(shù)據(jù)在交易、使用等過程中存在的問題,更好地對數(shù)據(jù)進(jìn)行管控,挖掘大數(shù)據(jù),發(fā)揮數(shù)據(jù)價值。
相關(guān)鏈接
大數(shù)據(jù)標(biāo)準(zhǔn)體系中五類標(biāo)準(zhǔn)
基礎(chǔ)標(biāo)準(zhǔn)
基礎(chǔ)標(biāo)準(zhǔn)是指為整個標(biāo)準(zhǔn)體系提供包括總則、術(shù)語和參考模型、元數(shù)據(jù)等基礎(chǔ)性標(biāo)準(zhǔn)。
技術(shù)標(biāo)準(zhǔn)
主要針對大數(shù)據(jù)相關(guān)技術(shù)進(jìn)行規(guī)范。包括數(shù)據(jù)治理和數(shù)據(jù)質(zhì)量兩類標(biāo)準(zhǔn)。其中,數(shù)據(jù)治理標(biāo)準(zhǔn)主要針對數(shù)據(jù)的收集、預(yù)處理、分析、可視化、訪問、能力成熟度評價模型等方面進(jìn)行規(guī)范。數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)主要針對數(shù)據(jù)質(zhì)量提出具體的管理要求和相應(yīng)的指標(biāo)要求,確保數(shù)據(jù)在產(chǎn)生、存儲、交換和使用等各個環(huán)節(jié)中的質(zhì)量,為大數(shù)據(jù)應(yīng)用打下良好的基礎(chǔ),包括質(zhì)量評價、數(shù)據(jù)溯源、質(zhì)量檢測等標(biāo)準(zhǔn)。
產(chǎn)品和平臺標(biāo)準(zhǔn)
主要針對大數(shù)據(jù)相關(guān)技術(shù)產(chǎn)品和應(yīng)用平臺進(jìn)行規(guī)范。包括關(guān)系型數(shù)據(jù)庫產(chǎn)品、非結(jié)構(gòu)化數(shù)據(jù)管理產(chǎn)品、智能工具、可視化工具、數(shù)據(jù)處理平臺和測試規(guī)范六類標(biāo)準(zhǔn)。其中關(guān)系型數(shù)據(jù)庫產(chǎn)品標(biāo)準(zhǔn)針對存儲和處理大數(shù)據(jù)的關(guān)系型數(shù)據(jù)庫管理系統(tǒng),從訪問接口、技術(shù)要求、測試要求等方面進(jìn)行規(guī)范,為關(guān)系型數(shù)據(jù)庫管理系統(tǒng)進(jìn)行大數(shù)據(jù)的高端事務(wù)處理和海量數(shù)據(jù)分析提供支持;非結(jié)構(gòu)化數(shù)據(jù)管理產(chǎn)品標(biāo)準(zhǔn)針對存儲和處理大數(shù)據(jù)的非結(jié)構(gòu)化數(shù)據(jù)管理系統(tǒng),從參考架構(gòu)、數(shù)據(jù)表示、訪問接口、技術(shù)要求、測試要求等方面進(jìn)行規(guī)范;智能工具用來幫助用戶對大數(shù)據(jù)進(jìn)行分析決策,包括ETL、OLAP、數(shù)據(jù)挖掘等工具,智能工具標(biāo)準(zhǔn)對智能工具的技術(shù)及功能進(jìn)行規(guī)范;可視化工具是對大數(shù)據(jù)處理應(yīng)用過程中所需用到的可視化展現(xiàn)工具的技術(shù)和功能要求進(jìn)行規(guī)范;大數(shù)據(jù)平臺標(biāo)準(zhǔn)是針對大數(shù)據(jù)存儲、處理、分析系統(tǒng)從技術(shù)架構(gòu)、建設(shè)方案、平臺接口等方面進(jìn)行規(guī)范;測試規(guī)范針對大數(shù)據(jù)的產(chǎn)品和平臺給出測試方法和要求。
大數(shù)據(jù)安全標(biāo)準(zhǔn)
數(shù)據(jù)安全作為數(shù)據(jù)標(biāo)準(zhǔn)的支撐體系,貫穿于數(shù)據(jù)整個生命周期的各個階段。拋開傳統(tǒng)的網(wǎng)絡(luò)安全和系統(tǒng)安全,大數(shù)據(jù)時代下的數(shù)據(jù)安全標(biāo)準(zhǔn)主要包括通用要求、隱私保護(hù)兩類標(biāo)準(zhǔn)。
應(yīng)用和服務(wù)標(biāo)準(zhǔn)
應(yīng)用和服務(wù)類標(biāo)準(zhǔn)主要是針對大數(shù)據(jù)所能提供的應(yīng)用和服務(wù)從技術(shù)、功能、開發(fā)、維護(hù)和管理等方面進(jìn)行規(guī)范。主要包括開放數(shù)據(jù)集、數(shù)據(jù)服務(wù)平臺和領(lǐng)域應(yīng)用數(shù)據(jù)三類標(biāo)準(zhǔn)。其中開放數(shù)據(jù)集標(biāo)準(zhǔn)主要對向第三方提供的開放數(shù)據(jù)包中的內(nèi)容、格式等進(jìn)行規(guī)范;數(shù)據(jù)服務(wù)平臺標(biāo)準(zhǔn)是針對大數(shù)據(jù)服務(wù)平臺所提出的功能性、維護(hù)性和管理性的標(biāo)準(zhǔn);領(lǐng)域應(yīng)用數(shù)據(jù)指的是各領(lǐng)域根據(jù)其領(lǐng)域特性產(chǎn)生的專用數(shù)據(jù)標(biāo)準(zhǔn),包括工業(yè)電子商務(wù)等領(lǐng)域。