EMC譚仲良:云計算可輕松實現(xiàn)數(shù)據(jù)獲取和分類
從海量數(shù)據(jù)中迅速找出想要的信息是件讓人十分愉快的事,但恐怕并不容易實現(xiàn)。
海量數(shù)據(jù)又稱大數(shù)據(jù),其價值遠比想象中來的真切。大數(shù)據(jù)對美國醫(yī)療保健行業(yè)每年潛在的價值可達3000億美元。在零售業(yè),使用大數(shù)據(jù)可能帶來營業(yè)利潤潛在的增長達60%。問題是,當用戶擁有越來越多的資源時,會發(fā)現(xiàn)其帶來的海量數(shù)據(jù)讓人無所適從,在海量數(shù)據(jù)中查找相關數(shù)據(jù)如同大海撈針。
別擔心,EMC大中華區(qū)云計算解決方案業(yè)務總監(jiān)譚仲良告訴《中國經(jīng)濟和信息化》,云計算和大數(shù)據(jù)的火爆也催生了新的行業(yè)數(shù)據(jù)科學家。他們能幫助公司從銷售報告、客戶社交網(wǎng)絡甚至語音電話等大數(shù)據(jù)中獲取、分類整理相關數(shù)據(jù)并且加以應用。作為企業(yè)用戶,首先要做好準備迎接云計算和海量數(shù)據(jù)來臨的挑戰(zhàn)。
私有云還是云
CEI:很多國外的云服務提供商都在中國推動私有云的建設,但也有人認為私有云并不是真正意義上的云計算,其只是企業(yè)的內部IT,你如何看待這個問題?
譚仲良:根據(jù)美國國家標準與技術學會(NIST)的定義,云計算是一種能夠通過網(wǎng)絡以便利的、按需的方式獲取計算資源(網(wǎng)絡、服務器、存儲、應用和服務)的模式,這些資源來自一個共享的、可配置的資源池,并能夠快速獲取和釋放。云計算的基本特征是:按需自助服務、廣泛的網(wǎng)絡接入、資源池、快速彈性、按使用量計費的服務。云計算的部署模式有私有云、公有云和混合云之分。私有云是云基礎設施為某個組織獨立運作的,私有云可以被該組織管理,也可以委托第三方管理。這些云基礎設施可以用于生產(chǎn)環(huán)境,也可以當作備用設備。
因此私有云也是真正意義的云,并不是企業(yè)內部現(xiàn)有IT環(huán)境的全新替換,而是現(xiàn)有IT基礎架構的不斷轉型。
CEI:現(xiàn)在很多企業(yè)都在建設自己的私有云,其私有云是如何實現(xiàn)跟公有云的連接的?
譚仲良:只要私有云與公有云遵從相同的標準或技術,就能實現(xiàn)私有云與公有云的無縫連接。EMC的虛擬存儲VPLEX能在私有云和公有云之間架起一道橋梁,通過與業(yè)界先進的虛擬化技術結合,例如VMwarevSphere和MicrosoftHyper-V,就能實現(xiàn)在私有云和公有云之間無縫的在線遷移應用和數(shù)據(jù),實現(xiàn)私有云和公有云之間的動態(tài)的資源共享。
CEI:你如何看待云計算產(chǎn)業(yè)的發(fā)展趨勢?混合云是大勢所趨嗎?
譚仲良:云計算產(chǎn)業(yè)是IT發(fā)展歷史上最大的一次浪潮,將徹底地改變IT部署、管理和使用的模式。云計算將促使現(xiàn)有企業(yè)IT系統(tǒng)的轉型?;旌显铺峁┝俗钜瞬毮康慕?jīng)濟性和業(yè)務的靈活性,將是大勢所趨。
CEI:那么混合云與私有云和公有云相比有哪些優(yōu)勢?
譚仲良:混合云通過虛擬化和整合,可以優(yōu)化工作負載來源。當私有云將要達到或處于業(yè)務高峰時,可以動態(tài)地遷移應用和數(shù)據(jù)到公有云中,優(yōu)化了業(yè)務爆發(fā)期的資源調配。混合云與私有云和公有云相比,在應用部署和維護標準的架構方面有更高的生產(chǎn)率和敏捷性?;旌显瓶梢詭椭覀兊目蛻羧〉酶咚降恼稀⒆詣踊托?。
CEI:目前,云計算在發(fā)展的過程中遇到的最大障礙是什么?作為云服務提供商應該如何突破?
譚仲良:目前在云計算的發(fā)展過程中遇到的最大障礙是缺乏規(guī)劃和優(yōu)化,以及信任。EMC云優(yōu)化服務可以幫助我們的客戶和云服務提供商規(guī)劃并優(yōu)化其云計算基礎架構,RSA(一家提供信息安全解決方案的公司,2007年被EMC收購)可以幫助我們的客戶和云服務提供商建立一個可信任的云計算架構。
無縫連接可以實現(xiàn)
CEI:今年3月,IDC發(fā)表的一份報告稱,預計大數(shù)據(jù)技術與服務市場銷售量將從2010年的32億美元增長到2015年的169億美元,其年均增長率會是一般IT市場的7倍。大數(shù)據(jù)市場的火爆讓人們更想搞清楚大數(shù)據(jù)到底是什么?
譚仲良:大數(shù)據(jù)是個發(fā)展中的概念。EMC所說的大數(shù)據(jù)是指數(shù)據(jù)集的大小遠遠超過現(xiàn)在使用的通用軟件工具,在能夠容忍的時間內捕獲、管理和處理這些數(shù)據(jù)的能力。大數(shù)據(jù)的大小是一個不斷變化的目標,不是固定的,單一數(shù)據(jù)集可以從幾個TB(1TB=1024GB)到許多個PB(1PB=1024TB)。大數(shù)據(jù)的例子包括:Web日志、物聯(lián)網(wǎng)的RFID射頻ID、傳感器網(wǎng)絡、社交網(wǎng)絡、社交數(shù)據(jù)、互聯(lián)網(wǎng)文本和文檔、互聯(lián)網(wǎng)搜索索引、呼叫詳細話單記錄、天文數(shù)據(jù)、大氣科研數(shù)據(jù)、基因測序數(shù)據(jù)、生物地球化學數(shù)據(jù)、生物學數(shù)據(jù)、視頻監(jiān)控、醫(yī)療影像、攝影歸檔、視頻歸檔、大型的電子商務等。大數(shù)據(jù)特點,一是數(shù)據(jù)集很大,從幾個TB到許多個PB,另一個某些大數(shù)據(jù)應用像基因測序、電影剪輯、地震研究等產(chǎn)生的單個文件,大小可能超過5TB。
CEI:通過大數(shù)據(jù)進行用戶行為的分析在哪些行業(yè)體現(xiàn)得最為成功?
譚仲良:大數(shù)據(jù)將是創(chuàng)新、競爭和提高生產(chǎn)率的下一個領域。大數(shù)據(jù)蘊藏著許多市場機會,我們需要抓住大數(shù)據(jù)的價值。例如,大數(shù)據(jù)對美國醫(yī)療保健行業(yè)來講,每年潛在的價值可達3000億美元;大數(shù)據(jù)對歐洲公共部門的管理來講,每年潛在的價值是2500億歐元;在零售業(yè),使用大數(shù)據(jù)可能帶來營業(yè)利潤潛在的增長達60%。從目前看,互聯(lián)網(wǎng)、電子商務、零售、醫(yī)療保健、電信等行業(yè)通過大數(shù)據(jù)進行用戶行為分析,可取得更大的成功。
CEI:傳統(tǒng)的數(shù)據(jù)倉庫、商業(yè)智能和數(shù)據(jù)分析技術能夠應付海量的數(shù)據(jù)信息嗎?企業(yè)對來勢洶洶的大數(shù)據(jù)應該如何應對?
譚仲良:傳統(tǒng)的數(shù)據(jù)倉庫、商業(yè)智能和數(shù)據(jù)分析技術不能在“能夠容忍”的時間內,捕獲、管理和處理海量的數(shù)據(jù)信息。它們只能處理部分數(shù)據(jù),而且不是實時處理。面對來勢洶洶的大數(shù)據(jù),企業(yè)的大數(shù)據(jù)之旅可以分成三步走:第一步構建一個基于云計算的大數(shù)據(jù)基礎架構,第二步提供敏捷的分析,第三步成為具備可預測性的企業(yè)。
CEI:大數(shù)據(jù)時代,云計算如何解決數(shù)據(jù)在云端的集成與分享、個人數(shù)據(jù)的無縫連接、數(shù)據(jù)的跟蹤分析和挖掘?
譚仲良:大數(shù)據(jù)和云計算是兩個不同的概念,但兩者之間有很多交集。簡單形容兩者的關系就是“大數(shù)據(jù)離不開云”。支撐大數(shù)據(jù)以及云計算的基礎原則思想是一樣的,即規(guī)模化、自動化、資源配置、自愈性,這些都是底層的技術原則,實際上大數(shù)據(jù)和云計算之間存在很多合力的地方。
在大數(shù)據(jù)時代,企業(yè)應該首先實現(xiàn)IT轉型,搭建云計算的基礎架構。有了自動化的云基礎架構,就可以幫助企業(yè)進行應用的轉型,把關鍵任務應用放到云計算環(huán)境中,可以是私有云,也可以是公有云。同時,自動化的云基礎架構也為大數(shù)據(jù)應用搭建了一個平臺,這些大數(shù)據(jù)應用通常是采用云計算中間件創(chuàng)建的。大數(shù)據(jù)和云計算的關系是云計算提供基礎架構平臺,大數(shù)據(jù)應用在這個平臺上運行。云計算帶來的是IT的轉型,而大數(shù)據(jù)帶來的是業(yè)務的轉型,IT的轉型是為業(yè)務轉型做準備的,沒有IT轉型就不可能實現(xiàn)業(yè)務的轉型。也就是說,云計算是大數(shù)據(jù)應用的基礎。
目前大量智能終端的出現(xiàn),促使最終用戶資源調配的轉型,解決了數(shù)據(jù)在云端的集成和分享,解決了個人數(shù)據(jù)的無縫連接,使得這些數(shù)據(jù)可以統(tǒng)一存放在云中,大數(shù)據(jù)的分析挖掘工具就可以針對這些數(shù)據(jù)進行實時分析和挖掘。