2016國(guó)外10家引人注意的大數(shù)據(jù)初創(chuàng)公司
數(shù)據(jù)的價(jià)值將會(huì)在未來(lái)越來(lái)越重要,看看國(guó)外的都有哪些牛逼的大數(shù)據(jù)創(chuàng)業(yè)公司。
大數(shù)據(jù)技術(shù)市場(chǎng)正處于這樣一個(gè)階段:Garnter認(rèn)為是從IT主導(dǎo)的、報(bào)告系統(tǒng)轉(zhuǎn)向業(yè)務(wù)主導(dǎo)、自助式服務(wù)分析的最后階段。其結(jié)果是出現(xiàn)了很多新業(yè)務(wù)智能和分析平臺(tái)可以滿足企業(yè)機(jī)構(gòu)對(duì)可訪問(wèn)性、敏捷性和更深入的分析洞察力的要求。
現(xiàn)在有很多初創(chuàng)公司提供這種下一代系統(tǒng),他們開(kāi)發(fā)新技術(shù)用于收集、管理和分析大數(shù)據(jù),不管這些數(shù)據(jù)是結(jié)構(gòu)化的還是非結(jié)構(gòu)化的、動(dòng)態(tài)的還是靜態(tài)的、本地的還是在云中的。

下面就是2016年引起我們注意的10個(gè)很酷的大數(shù)據(jù)初創(chuàng)公司。
Anodot
CEO: David Drai
Anodot在2015年11月走出隱身模式,推出了實(shí)時(shí)異常檢測(cè)和操作智能技術(shù)——擁有機(jī)器學(xué)習(xí)專利算法的軟件,可以自動(dòng)進(jìn)行業(yè)務(wù)分析、查明性能問(wèn)題并尋找商業(yè)機(jī)會(huì)。Anodot的目標(biāo)是從大量數(shù)據(jù)中查找異常值,并將這些結(jié)果轉(zhuǎn)化為有價(jià)值的業(yè)務(wù)洞察。
Anodot的技術(shù)旨在用于電子商務(wù)網(wǎng)站、數(shù)字廣告系統(tǒng)和物聯(lián)網(wǎng)網(wǎng)絡(luò),以提高運(yùn)營(yíng)效率,最大限度增加收入。
Anodot位于以色列的Ra'Anana,以及加州的桑尼維爾,在9月的B輪融資中獲得了800萬(wàn)美元。
Confluent
CEO: Jay Kreps
在大數(shù)據(jù)管理和分析中,處理實(shí)時(shí)的流式數(shù)據(jù)是最大的挑戰(zhàn)之一。解決這個(gè)問(wèn)題的其中一項(xiàng)技術(shù)就是開(kāi)源的Apache Kafka通訊代理項(xiàng)目,提供了高吞吐、低延遲的軟件,用于處理實(shí)時(shí)數(shù)據(jù)。
Confluent是由Apache Kafka創(chuàng)始開(kāi)發(fā)者創(chuàng)建的,提供了一個(gè)圍繞Kafka的完整實(shí)時(shí)數(shù)據(jù)平臺(tái),可作為一個(gè)容錯(cuò)的、高度可擴(kuò)展的通訊系統(tǒng)。該軟件可用于手機(jī)來(lái)自用戶活動(dòng)日志、股票行情系統(tǒng)、設(shè)備儀表的數(shù)據(jù),以及其他廣泛用例中的數(shù)據(jù)。
今年5月,這家位于加州帕洛阿爾托的公司宣布提供Confluent Platform 3.0,通過(guò)融合Kafka Streams把流處理能力添加到應(yīng)用中,還有在企業(yè)機(jī)構(gòu)上下操作Kafka的Confluent Control Center。
Koverse
CEO: Jon Matsuo
Koverse開(kāi)發(fā)了一款“盒中數(shù)據(jù)湖”的平臺(tái),并稱它可以收集大數(shù)據(jù)并更快速地運(yùn)用于生產(chǎn)中,其成本要低于現(xiàn)有的技術(shù)和方法。
這家位于西雅圖的公司創(chuàng)建于2012年,最早的1.0版本是在兩年前首次公布的。Koverse Platform 2.0是在6月發(fā)布的,將Apache Accumulo“分布式鍵值庫(kù)”技術(shù)和該公司自己的Universal Indexing Engine結(jié)合到一起。
聯(lián)合創(chuàng)始人Paul Brown(首席產(chǎn)品官)和Aaron Cordova(首席技術(shù)官)曾經(jīng)是美國(guó)國(guó)家安全局的數(shù)據(jù)科學(xué)家,在那里他們幫助開(kāi)發(fā)了最早的Accumulo項(xiàng)目,重新架構(gòu)了國(guó)家安全局的數(shù)據(jù)基礎(chǔ)架構(gòu),以更好地處理意外的數(shù)據(jù)分析情況?! ?/p>
Maana
CEO: Babur Ozden
Maana開(kāi)發(fā)了Maana Knowledge Platform,這個(gè)數(shù)據(jù)搜索和發(fā)現(xiàn)軟件是從大量系統(tǒng)或者“孤島”中收集數(shù)據(jù),并將其轉(zhuǎn)變?yōu)榭梢员粯I(yè)務(wù)線應(yīng)用采用的業(yè)務(wù)洞察。該系統(tǒng)是構(gòu)建在Apache Spark處理引擎的。
Maana位于加州帕洛阿爾托,創(chuàng)建于2012年,在2015年5月正式發(fā)布,定位是收集和分析由物聯(lián)網(wǎng)網(wǎng)絡(luò)生成的大量數(shù)據(jù)。9月該公司首次公布了其產(chǎn)品的Winter '17版本,Knowledge Applications用于優(yōu)化像供應(yīng)鏈和呼叫中心管理這樣的業(yè)務(wù)流程,Knowledge Assistants用于創(chuàng)建新的分析模型。
Maana在2016年5月進(jìn)行的B輪融資中獲得2600萬(wàn)美元,氣走好難過(guò)大部分來(lái)自該公司的石油和天然氣及行業(yè)客戶,包括殼牌、雪佛龍、沙特阿美、英特爾和通用電氣等公司。
Pachyderm
CEO: Joe Doliner
掌握著當(dāng)前一代大數(shù)據(jù)技術(shù)的初創(chuàng)公司Pachyderm,已經(jīng)開(kāi)發(fā)出了一種開(kāi)源分析引擎,采用Docker容器做分布式計(jì)算。
這里的重點(diǎn)是提供了一個(gè)容器化、模塊化、可擴(kuò)展的數(shù)據(jù)分析基礎(chǔ)設(shè)施,采用像Docker和Kubernetes這樣的工具作為構(gòu)建塊。該公司的Pachyderm File System和Pachyderm Pipeline System軟件幫助數(shù)據(jù)經(jīng)理和分析師構(gòu)建機(jī)器學(xué)習(xí)通道和數(shù)據(jù)ETL(提取、轉(zhuǎn)換和加載)工作流程。
Pachyderm創(chuàng)建于2014年,位于舊金山,在今年6月的種子輪融資中獲得了200萬(wàn)美元。
StreamSets
CEO: Girish Pancha
StreamSets是另外一家解決管理動(dòng)態(tài)數(shù)據(jù)挑戰(zhàn)的公司。更具體地說(shuō),StreamSets開(kāi)發(fā)的軟件防止“數(shù)據(jù)漂移”的潛在問(wèn)題——數(shù)據(jù)在源頭的時(shí)候可能會(huì)遇到這種不可預(yù)測(cè)的突變情況,并在應(yīng)用使用這些數(shù)據(jù)的時(shí)候出現(xiàn)問(wèn)題。
StreamSets的StreamSets Data Collector軟件被用于在任何數(shù)據(jù)源和任何應(yīng)用之間構(gòu)建復(fù)雜的數(shù)據(jù)流。9月,StreamSets首次推出了StreamSets Dataflow Performance Manager用于管理數(shù)據(jù)流操作。
StreamSets位于舊金山,創(chuàng)建于2014年,創(chuàng)始人包括CEO Girish Pancha、前Informatica首席產(chǎn)品官、現(xiàn)首席技術(shù)官Arvind Prabhaker,以及前Cloudera的早期員工、工程負(fù)責(zé)人。
Striim
President and CEO: Ali Kutay
Striim創(chuàng)建于2012年,創(chuàng)始人包括來(lái)自Golden Gate Software、Oracle、Informatica、WebLogic以及其他知名數(shù)據(jù)管理公司的前高管。
Striim公司位于加州帕洛阿爾托,它的軟件將流數(shù)據(jù)集成與流操作智能結(jié)合到一個(gè)系統(tǒng)內(nèi),實(shí)現(xiàn)持續(xù)的查詢/處理和流式分析。11月,Striimfault了新版本軟件,可以配合Google Big Query、Kafka和MapR Technologies使用。
Striim在3月獲得了1000萬(wàn)美元的額外資金,使其B輪融資的總金額得到了3000萬(wàn)美元。
Stytch
CEO: Mark Cunningham
Stytch在4月首次推出了自己端到端的數(shù)據(jù)分析平臺(tái),提供系統(tǒng)工具用于自助服務(wù)式的數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)建模、數(shù)據(jù)發(fā)現(xiàn)、報(bào)告和儀表板。Stytch得到了Dun & Bradstreet的支持,Stytch系統(tǒng)的主要賣(mài)點(diǎn)是它連接到了Dun & Bradstreet龐大業(yè)務(wù)數(shù)據(jù)庫(kù)。
這家位于溫哥華的公司創(chuàng)建與2015年8月。創(chuàng)始人、首席執(zhí)行官M(fèi)ark Cunningham從1992年就涉足商業(yè)智能領(lǐng)域,當(dāng)時(shí)他的家族企業(yè)開(kāi)始開(kāi)發(fā)Crystal Reports,一款早期的、非常成功的Windows報(bào)告工具。
Talena
CEO: Nitin Donde
Talena提供了“永遠(yuǎn)在線”的大數(shù)據(jù)管理軟件,幫助企業(yè)保護(hù)有價(jià)值的數(shù)據(jù)資產(chǎn),并基于關(guān)鍵業(yè)務(wù)應(yīng)用快速迭代。Talena的技術(shù)提供了備份和恢復(fù)、測(cè)試和開(kāi)發(fā)管理、以及跨Hadoop、NoSQL數(shù)據(jù)庫(kù)(例如Cassandra和Couchbase)以及現(xiàn)代數(shù)據(jù)倉(cāng)庫(kù)(例如HPE Vertica)的歸檔能力。
今年3月Talena發(fā)布了針對(duì)大數(shù)據(jù)管理任務(wù)的ActiveRx預(yù)測(cè)分析基礎(chǔ)設(shè)施。該軟件解決了如何將機(jī)器學(xué)習(xí)用于預(yù)測(cè)數(shù)據(jù)可用性、如何將備份數(shù)據(jù)轉(zhuǎn)變?yōu)閯?dòng)態(tài)數(shù)據(jù)資產(chǎn)的問(wèn)題。
Waterline Data
CEO: Alex Gorelik
隨著企業(yè)機(jī)構(gòu)將基于Hadoop的數(shù)據(jù)湖聚合起來(lái)用于存儲(chǔ)海量數(shù)據(jù),找到如何以最佳方式利用這些信息就變成一個(gè)重大挑戰(zhàn)——更不用說(shuō)隨之而來(lái)令人頭疼的數(shù)據(jù)治理問(wèn)題了。
Waterline Data解決了Smart Data Catalog軟件的問(wèn)題,構(gòu)建了一個(gè)完成的數(shù)據(jù)湖資產(chǎn)庫(kù),改善了數(shù)據(jù)發(fā)現(xiàn)和數(shù)據(jù)監(jiān)管,讓企業(yè)更容易從這些資產(chǎn)中獲取價(jià)值。
Waterline Data創(chuàng)建于2013年,位于加州山景城,在1月的B輪融資中獲得1600萬(wàn)美元。