時間:2022-06-23 13:06:21
導言:作為寫作愛好者,不可錯過為您精心挑選的10篇大數據平臺解決方案,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內容能為您提供靈感和參考。
大數據存儲不是一類單獨的產品,它有很多實現方式。EMC Isilon存儲事業部總經理楊蘭江概括說,大數據存儲應該具有以下一些特性:海量數據存儲能力,可輕松管理PB級乃至數十PB的存儲容量;具有全局命名空間,所有應用可以看到統一的文件系統視圖;支持標準接口,應用無需修改可直接運行,并提供API接口進行面向對象的管理;讀寫性能優異,聚合帶寬高達數GB乃至數十GB;易于管理維護,無需中斷業務即可輕松實現動態擴展;基于開放架構,可以運行于任何開放架構的硬件之上;具有多級數據冗余,支持硬件與軟件冗余保護,數據具有高可靠性;采用多級存儲備份,可靈活支持SSD、SAS、SATA和磁帶庫的統一管理。
通過與中國用戶的接觸,楊蘭江認為,當前中國用戶最迫切需要了解的是大數據存儲有哪些分類,而在大數據應用方面面臨的最大障礙就是如何在眾多平臺中找到適合自己的解決方案。
EMC針對不同的應用需求可以提供不同的解決方案:對于能源、媒體、生命科學、醫療影像、GIS、視頻監控、HPC應用、某些歸檔應用等,EMC會首推以Isilon存儲為核心的大數據存儲解決方案;對于虛擬化以及具有很多小文件的應用,EMC將首推以VNX、XtremIO為核心的大數據存儲解決方案;對于大數據分析一類的應用需求,EMC會綜合考慮客戶的具體需求,推薦Pivotal、Isilon等一體化的解決方案。在此,具體介紹一下EMC用于大數據的橫向擴展NAS解決方案——EMC Isilon,其設計目標是簡化對大數據存儲基礎架構的管理,為大數據提供靈活的可擴展平臺,進一步提高大數據存儲的效率,降低成本。
EMC Isilon存儲解決方案主要包括三部分:EMC Isilon平臺節點和加速器,可從單個文件系統進行大數據存儲,從而服務于 I/O 密集型應用程序、存儲和近線歸檔;EMC Isilon基礎架構軟件是一個強大的工具,可幫助用戶在大數據環境中保護數據、控制成本并優化存儲資源和系統性能;EMC Isilon OneFS操作系統可在集群中跨節點智能地整合文件系統、卷管理器和數據保護功能。
楊蘭江表示,企業用戶選擇EMC Isilon的理由可以歸納為以下幾點。第一,簡化管理,增強易用性。與傳統NAS相比,無論未來存儲容量、性能增加到何種程度,EMC Isilon的安裝、管理和擴展都會保持其簡單性。第二,強大的可擴展性。EMC Isilon可以滿足非結構化數據的存儲和分析需求,單個文件系統和卷中每個集群的容量為18TB~15PB。第三,更高的處理效率,更低的成本。EMC Isilon在單個共享存儲池中的利用率超過80%,而EMC Isilon SmartPools軟件可進一步優化資源,提供自動存儲分層,保證存儲的高性能、經濟性。第四,靈活的互操作性。EMC Isilon支持眾多行業標準,簡化工作流。它還提供了API可以向客戶和ISV提供OneFS控制接口,提供Isilon集群的自動化、協調和資源調配能力。
EMC Isilon大數據存儲解決方案已經在醫療、制造、高校和科研機構中有了許多成功應用。
方案點評
EMC Isilon是一個強大但簡單的橫向擴展NAS方案,適用于希望投資數據管理而不是單純存儲的企業。當初,EMC將收購來的分布式數據倉庫軟件廠商Greenplum的軟件與Isilon存儲組合成了EMC最早的大數據解決方案。用戶既可以分開選擇Greenplum軟件或Isilon存儲,也可以選擇由Greenplum軟件和Isilon存儲組成的一體機解決方案。現在,Greenplum軟件雖然已歸Pivotal公司,但EMC是Pivotal的經銷商與合作伙伴,Greenplum與Isilon存儲的組合方案并不會因此受到影響。
HDS UCP:統一平臺 應用優化
HDS中國區解決方案與專業服務事業部總監陳戈認為,大數據存儲應該是一個解決方案:“大數據解決方案是由基礎架構的各部件組成的,包含數據存儲、計算和分析,而存儲是此架構中的一部分。”
大數據的存儲類型與傳統的存儲類型有一定區別:在大數據存儲中,更多的應用是一次寫、多次讀,讀得更多是大數據存儲的一個特點,而在傳統的數據存儲中,讀寫是隨機的,由于每個應用不同,其讀寫的比例也是隨機的;大數據存儲需要具有橫向的可擴展性,并可支持多種接口、多種數據訪問協議,便于不同數據進入這個大數據平臺。
談到中國用戶在大數據存儲應用中最迫切的需求是什么,陳戈認為,中國用戶最迫切的需求是如何逐步實現大數據應用,即用戶從現有的模式如何過渡到大數據,如何更好地利用大數據進行經營分析。
大數據的經典定義可以歸納為四個“V”,但企業不可能一步到位實現四個“V”,這需要一個循序漸進的過程。海量的、多種類型的數據是一次性全部載入到大數據中,還是通過現有的平臺進行數據初選,再導入到大數據平臺中,是兩種不同的實現途徑。“先通過現有平臺進行數據初選,再導入到大數據平臺,這種方式更適合于客戶逐漸實現大數據,可以縮短用戶實現大數據應用的時間。”陳戈表示,“大數據主要是非結構化數據。用戶可以使用基于對象數據存儲的HCP,利用其獨特的元數據采集和智能工具,對非結構化文件數據進行管理,實現智能的自動化,這有助于對數據進行深度分析,幫助客戶從單一系統中存儲、共享、同步、保護、保存、分析和檢索文件數據,減少垃圾數據,進而為大數據分析建立一個良好的基礎。”
談到用戶在大數據應用中遇到的主要障礙,陳戈表示,一方面,應用軟件本身的智能程度是否能滿足行業應用需求,應用軟件是否已經成型,大數據人才是否具備等,是讓大數據應用落地的關鍵;另一方面,如何抽取數據,放在大數據平臺中進行相應的計算是另一個關鍵問題。
HDS可為所有數據提供單一、可擴展的虛擬化集成平臺。HDS推出了“三步”云戰略,從基礎架構、內容和信息三個層面幫助客戶解決目前所遇到的問題。具體來看,通過“基礎架構云”,HDS可以幫助客戶進行虛擬化和集成管理,實現數據中心的整合;在第二層的“內容云”當中,HDS可以按需提供內容,更可以不受應用限制地進行數據搜索和集成;在第三層的“信息云”中,針對所有數據類型,HDS在其存儲平臺中融入了分析功能,使客戶可以從數據信息中獲取洞察力。
HDS提供的UCP for SAP HANA集成了基于大量數據集的創新和內存分析技術,并提供實時的洞察力,從而使當前的信息驅動型企業可以加快其商業決策的速度。陳戈介紹說,UCP for SAP HANA解決方案結合了HDS刀片服務器技術、企業級存儲系統和業內領先的網絡組件,在這樣一個集成的、高性能的硬件平臺上可以快速交付SAP下一代內存計算技術。全球已有超過200家客戶在使用HDS和SAP的大數據解決方案。
方案點評
其實,HDS的“三步”云戰略也可以看成是其大數據戰略。HDS借助以UCP為核心的大數據平臺,可以幫助企業用戶構建從基礎架構到內容歸檔和搜索,直至信息提取和分析的全面、高效的大數據解決方案。HDS的“信息云”直接與大數據相關。UCP是一個集成了計算、存儲與網絡的一體化平臺,它既可以提供像一體機一樣的整合性、簡單性,又可以提供靈活的選擇,連接第三方的設備組件。HDS還通過與包括SAP在內的眾多大數據分析類的合作伙伴合作,針對行業定制優質的大數據解決方案。
HP StoreAll :快速部署 極速搜索
中國惠普有限公司企業集團存儲產品部存儲架構師張楠向記者表示,大數據存儲是一套解決方案,應該能夠對大數據的Volume、Velocity、Variety和Value四個方面提供全面的支持。
第一,大數據存儲要支持海量級的數據存儲,比如具有PB級的存儲能力。第二,大數據存儲要支持更高的存儲速度,支持10Gb甚至更高的網絡連接。第三,大數據存儲要支持數據的多樣性,如圖片、文本、視頻、音頻等。第四,大數據最重要的是價值的體現,而為了實現這一點,存儲本身應該具備快速、智能的數據檢索能力。“在存儲的最底層提供最直接、快捷的數據檢索。這一過程簡單說就是,將上層的數據挖掘工作下移,充分利用存儲強大的處理能力和數據識別能力。”張楠舉例說,“比如,在秒級的單位內對數據進行極速的搜索, 從幾千萬甚至上億個文件中找到目標數據。”
另外,模糊查詢能力也是大數據存儲不可缺少的功能。智能的模糊查詢將為大數據平臺提供更加便捷的存儲服務能力,使得存儲更像一臺智能的高速計算設備。
目前,很多中國用戶在存儲廠商的引導下,片面追求存儲的大容量和高性能,而忽略了大數據存儲本身應該提供的其他額外屬性。中國用戶在實施大數據的過程中經常遇到的障礙有以下兩方面:第一,無法將存儲與大數據平臺進行對接;第二,無法充分利用大數據存儲的價值,也很難將其運用到實際的業務中。張楠表示,究其原因,主要在于有些大數據存儲產品沒有開放的接口協議,或沒有針對用戶的大數據場景進行特別優化,也沒有用戶容易接受的易用的管理方式等。
惠普在大數據方面可以提供軟硬結合的解決方案。惠普在收購Autonomy公司之后,將其軟件與惠普的硬件平臺進行了整合, 形成了一套完整的大數據解決方案。張楠介紹說,在存儲方面,惠普擁有像StoreAll這樣的大數據存儲平臺。借助HP StoreAll硬件平臺,用戶除了可以實現海量數據的存儲和高速數據訪問以外,還能實現高級的數據檢索功能,對特殊文件進行快速定位。同時,結合HP Autonomy軟件的特性,惠普還引入了模糊查詢、智能語義庫等概念,可以幫助企業用戶通過存儲底層為上層業務帶來所需的大數據業務價值。
如今,閃存不僅在大數據領域,而且在Tier 1存儲市場同樣占據著十分重要的地位。對于大數據平臺來說,閃存可用來提升存儲的存取速度,降低I/O的響應時間等。針對那些I/O壓力十分明確的大數據平臺, SSD可以發揮其效果, 提升存儲的整體性能。但是,SSD并不是萬能的。因為大部分的數據都是非結構化的,而非結構化數據對I/O的響應要求遠遠沒有對帶寬的需求大,所以,讓用戶花數倍的價格購買SSD存儲在目前來看還是比較困難的。從目前情況看,引入閃存的大數據解決方案還不是很普遍。
方案點評
惠普在大數據方面收購了兩個軟件公司Vertica與Autonomy,然后將它們的軟件與原有的硬件平臺進行整合,針對結構化和非結構化的數據都可以提供針對性的解決方案。惠普在將大數據軟件與存儲硬件結合上也進行了嘗試,其中一個成功的例子就是HP StoreAll大數據存儲平臺。HP StoreAll具有以下特點:橫向擴展,最大可以擴展到16TB;集成HP Autonomy搜索引擎,可以快速搜索,實現實時大數據的價值;內置對OpenStack的支持,可快速部署;支持文件和對象類型的數據存儲。
NetApp:統一架構 無限擴展
如今,企業若想獲得成功,就必須想方設法應對具有前所未有的復雜性、高性能的海量數據,并盡可能地管理這些數據,從中發掘更大的商業價值。
對于國內用戶來說,無論企業的規模和數據量大小如何,運用大數據的關鍵在于,企業是否把大數據作為一個真正的工具,去體現企業的差異化,從而提升競爭力。隨著越來越智慧的企業信息化的發展,IT不再是束縛企業發展的瓶頸,而是真正地融入了企業自身的業務中。越來越多的公司將大數據成功地運用于企業的商業模式。例如,在歐美,很多企業已經著手將大量資源投放在大數據領域。反觀國內,在金融領域,有為數不少的企業通過大數據的分析工具來分析金融的走勢,實現風險管理,進行信用卡的追蹤等。此外,像零售、制造、電信等行業也已在嘗試利用大數據分析工具為企業營銷和決策提供支撐。
無論企業現在是否正在使用大數據工具,企業都應全面地考慮自身未來發展的需求,選擇一個廠家的平臺與之共同發展,這可以有效避免因數據和應用遷移帶來的麻煩。
在大數據方面,NetApp能夠幫助企業實現數據管理,應對業務挑戰的極限,將以數據為導向的洞察轉化為有效行動。若想將數據轉化為商機,僅僅提升管理能力是不夠的,需要徹底轉變數據和業務之間的聯系模式。NetApp可以幫助企業用戶持續管理數據,迅速把握意料之外的新商機,永久保存所有數據,并在靈活、開放的存儲平臺之上打造屬于企業自己的大數據解決方案。
NetApp提供了可高效處理、分析、管理和訪問大規模數據的大數據解決方案。NetApp的解決方案組合可劃分為分析、帶寬和內容三個主要用例,這被稱之為大數據的“ABC”基本要素。
具體來看,分析(Analysis)是指針對極大數據集的高效分析。NetApp分析解決方案就是幫助用戶深入了解和利用數字世界,將數據轉化為高質量的信息,以及提供關于業務的更深入見解,從而幫助企業做出更好的決策。
帶寬(Bandwidth)是指適用于數據密集型工作負載的性能。此類解決方案著重于為速度非常快的工作負載提供更高的性能。高帶寬應用包括高性能計算(能以極快的速度執行復雜的分析)、用于監控和任務規劃的高性能視頻流、媒體和娛樂領域中的視頻剪輯和播放。
內容(Content)是指無限的安全數據存儲。此類解決方案著重于滿足可擴展的安全數據存儲需求。內容解決方案必須支持存儲的無限擴展能力,以便企業可以根據需要存儲任意多的數據,并能在需要時找到所需的數據。
NetApp致力于通過一系列解決方案來提供高性能的運算和大數據的應用。2013年11月,NetApp再次更新了E系列家族產品,推出E2700和E5500。該系列產品采用可輕松擴展的設計,適用于要求99.999%的可靠性且穩定、高性能的工作負載。
用戶在采購大數據存儲產品時,需要注意以下五個方面的問題:大數據存儲必須具有向上擴展與向外擴展的能力;架構必須是針對工作負載進行優化的,具有實時處理能力;具有整合的數據保護功能;保證7×24小時運行不中斷,可在線進行容量擴展,實施數據遷移等;可以實現服務的自動化。
方案點評
NetApp的技術優勢集中體現在其統一存儲平臺上,從入門級產品到企業級產品,全部基于同一個體系架構和操作系統,不僅部署和使用方便,而且升級和擴展非常簡單。當初,NetApp收購LSI Engenio,其中一個重要的原因就是為了大數據。2013年,NetApp不斷更新E系列產品線,推出E2700和E5500等。E5500可以支持高IOPS混合工作負載和數據庫、高性能文件系統和帶寬密集型流等應用,可確保數據的高可用性、完整性和安全性。
曙光XData:高度集成 貼近行業
關于大數據存儲,目前業界沒有一個通用的定義。曙光信息產業股份有限公司總裁助理兼存儲產品線產品總監惠潤海從曙光大數據平臺和解決方案角度,概括出大數據存儲的主要特征。
首先,大數據存儲必須支持全類型數據, 包括結構化、半結構化和非結構數據,實現統一數據支持。
其次,存儲性能上,一方面,大數據存儲要支持海量數據,并且要在保證數據可靠性的基礎之上,實現容量與性能的線性擴展;另一方面,為了實現大數據的價值,批處理和實時處理兩種措施都需要高性能的數據訪問獲取能力。
最后,在系統達到一定規模之后,系統的易用性和可管理性也是不可或缺的。
從應用角度來說,目前中國用戶在大數據存儲應用中最迫切的需求,是如何真正實現用戶數據的價值,如何驅動業務發展,實現決策和運營。“從系統構建層面說,要實現數據高性價比的存儲和管理,同時滿足數據服務的相關需求。”惠潤海表示。
針對用戶對大數據存儲的需求, 曙光推出了像大數據一體機這樣的全類型數據分析型產品,同時還基于該產品構建了基于行業的解決方案,以幫助用戶實現大數據落地。
“除此之外, 我們還提供了大數據統一數據中心解決方案, 涵蓋了像主攻事物處理的DS900、DS800,以及針對文件存儲的Parastor等存儲產品。我們基于這些存儲產品構建了大數據運營管理平臺。”惠潤海介紹說,“曙光的優勢不僅在于可以提供全面的產品支撐,更重要的是能夠提供數據生命周期過程服務支持。目前,我們提供的免費維保期限為5年。”
曙光開發了針對不同行業和應用場景的大數據存儲解決方案。以金融行業為例,目前國內四大行的應用系統每年產生的非結構化數據量已達到PB級,結構化數據也以百TB計。面對如此大量的數據,如何存儲、管理、利用和盤活它們呢?惠潤海認為,只有通過商業智能和高級分析應用解決方案才能將數據的價值最大程度地發揮出來。
針對金融行業用戶的需求,曙光開發的XData大數據解決方案利用優化的大數據處理技術,對文件管理、歷史數據查詢和數據分析類應用等進行深入研究,為數據爆炸式增長帶來的海量數據存儲及分析應用提供高可靠的解決方案。
曙光金融行業XData大數據解決方案采用曙光自主研發的SN-MPP并行數據庫,同時結合大數據處理事實標準Hadoop,并充分考慮了多方面的數據收集,加入ETL工具和連接驅動器,提供了類SQL的接口,還和現有金融業務系統進行對接。
10月18日,在微軟公司大數據媒體日活動現場,微軟分享了其在大數據領域的最新研究成果和解決方案,來自國內的銀行、汽車、交通運輸、醫療衛生和零售業用戶分享了其應用體驗。
大掌控、大智匯、大洞察
在大數據成為流行詞之前,微軟便已著手于大數據的應用與研發,例如微軟Bing的高質量搜索結果,便是通過分析超過100PB的數據得到的。微軟大數據解決方案的目標,是讓所有用戶都能獲得來自任何數據有價值的洞察力。
微軟大中華區副總裁兼市場戰略部副總經理、大中華區首席云戰略官謝恩偉介紹,為了實現這一目標,微軟為大數據解決方案制定了全面的戰略——大掌控、大智匯、大洞察。
大掌控,即“支持所有數據類型的現代化的管理層”。微軟大數據解決方案的數據管理平臺可以無縫地存儲和處理包括結構化、非結構化和實時數據在內的所有類型的數據。微軟推出的HDInsight是一種適合企業使用的、基于HDP的Hadoop服務,它將Windows的簡易性和可管理性帶給Hadoop,提供了結合Hadoop的擴展平臺,并為大數據提供了靈活且可擴展的云。
大智匯,即“搜索并結合廣泛數據,進行先進分析與精煉,從而提高數據價值的富集層”。微軟大數據解決方案,通過將數據和模型與公開的數據服務相結合,實現了突破性的數據發現,例如自動發現與共享防火墻外部的和第三方的數據源等。
大洞察,即“用戶熟悉的工具可為用戶提供具有直觀洞察力的洞悉層”。微軟大數據解決方案可以使客戶通過熟悉的由Hive add-in for Excel生成的Excel界面,從Hadoop功能中獲取有價值的洞察力,也可經由企業熟悉的BI工具,如SQL Server 分析服務、PowerPivot和通過Hive Open Database Connectivity 驅動生成的Power View來分析Hadoop中的非結構化數據。
數據分析結果要“傻瓜化”
“我們要將挖掘與分析的結果直觀呈現,轉換為用戶真正需要的有價值的洞察力。” 微軟全球高級副總裁、大中華區董事長兼首席執行官賀樂賦說。
大數據不一定是復雜的分析
許多人一提到大數據,首先想到的是復雜的數據分析。這讓有些希望采用大數據分析工具的用戶產生了畏難情緒,也讓有些用戶產生了誤解,認為大數據分析只是那些擁有復雜業務流程和海量數據的大企業的事。市場研究機構麥肯錫的研究人員表示:“要創造新的重大價值,并不一定要采用復雜的大數據分析方法,有時只要能保證數據的可用性或對數據應用進行基本的分析,就能獲得所需的重要價值。”
不同的企業或一個企業內部不同的部門對數據分析和數據價值的理解都不相同。企業處于不同的信息化發展階段,也會設定不同的數據分析目標,采用不同的數據分析工具。正是基于此,戴爾率先提出了大數據成熟度模型。戴爾公司全球企業級解決方案副總裁Cheryl Cook表示:“這一模型已經得到了業內許多分析機構的認可。所有行業以及所有數據應用都適用于此模型。”
如下圖所示,大數據成熟度模型分成五個階段。第一個階段,數據處于混亂狀態,數據存儲無章可循,數據難以訪問,企業的信息系統處于高風險狀態。第二個階段,實現數據的保留。在這個階段,企業被動地對數據進行存儲。數據雖然經過一定的處理,但還不具有高質量,數據的訪問也會受到一定限制。第三個階段,實現存儲的優化。在這個階段,通過對存儲系統的進一步優化以及基于策略的控制與管理,用戶可以逐步發現數據的價值。第四個階段,實現簡單的分析。在存儲優化的基礎上,用戶可以進行數據建模和簡單的數據分析,對歸檔數據進行搜索等。第五個階段,實現復雜的分析。在這個階段,大數據分析工具將得到充分應用,用戶可以進行比較復雜的建模、分析和決策。經過上述五個階段,曾經雜亂無章的數據也將經歷從數據到信息再到知識的轉變過程,最終成為企業決策的重要依據。
這個大數據成熟度模型可以解答人們對于大數據應用的幾個疑惑。第一,用戶使用大數據分析工具,并不意味著一定要進行復雜的分析。舉例來說,處于存儲優化階段的用戶就可以實現無障礙的數據訪問,并能獲得所需的數據價值。第二,大數據的應用要經歷一個逐步完善的過程,必須循序漸進,先做好數據存儲和優化,然后再進行數據分析。第三,大數據解決方案通常包括兩個部分:一是大數據保留解決方案,二是大數據分析解決方案。將兩類解決方案有機地結合在一起,才能有效降低大數據分析應用的成本,更好地挖掘數據的價值。Cheryl Cook表示,戴爾可以提供上述兩種解決方案。一方面,戴爾可以提供針對結構化和非結構化數據的大數據保留解決方案,主要包括存儲虛擬化與整合、應用程序優化、數據保護、災難恢復以及數據保留與管理解決方案;另一方面,戴爾還能提供支持Hadoop、Cloudera等開源軟件的大數據分析解決方案。
記者曾與包括大慶油田、太平洋保險公司等在內的一些用戶進行過交流。它們目前都沒有計劃部署大數據應用。“從全球范圍來看,大數據應用還處于起步階段。”戴爾亞太及日本地區商用事業部企業解決方案副總裁Philip A. Davis表示,“與云計算興起時一樣,可能要經過兩三年的市場培育,用戶才能逐漸接受大數據應用。”
中國東方航空股份有限公司信息部總經理嚴振紅介紹說:“在大數據的概念出現以前,我們就在做客戶數據、經營數據的分析工作。但是客戶數據庫、經營數據庫等都是相互獨立的,數據不能共享。現在,我們要做的是將這些系統的數據整合起來,統一進行分析。”
Hadoop不是萬能的
簡單來說,Hadoop是一個能夠對大量數據進行分布式處理的軟件框架。Hadoop最獨特的優勢在于為用戶提供了一個分布式的、高容錯的文件系統和加速數據處理的辦法。隨著Web 2.0、社交網站的大規模興起,人們需要一個高效的處理非結構化數據的平臺。Hadoop正好可以滿足人們的需求。有些人甚至在Hadoop和大數據之間劃上了等號。Hadoop能夠解決大數據應用的所有難題嗎?
“Hadoop是一個復雜的工具套件。如果沒有廠商或專業技術人員的幫助,用戶自己部署Hadoop是一件十分困難的事。目前,Hadoop的應用并不普及。互聯網用戶是最早采用Hadoop平臺的。”Philip A.Davis表示,“如果想讓大數據解決方案充分發揮其作用,就必須搭建一個高效的信息基礎架構,實現信息基礎架構的自動化、智能化,同時提高其可管理性。”
Hadoop的應用是有一定技術門檻的。如今,許多IT廠商都推出了基于Hadoop的解決方案包,其目的是幫助用戶簡化Hadoop的部署與應用。Philip A.Davis表示:“戴爾提供的基于Hadoop的大數據分析方案可以將Hadoop的部署周期從原來的兩個月縮短至兩天。”
VMware全球高級副總裁范承工也認為,由于缺少精通Hadoop技術的專業人才,Hadoop的部署對于用戶來說是一件費時費力的事。如今,VMware可以將Hadoop部署在虛擬化架構之上,將部署工作從半自動化變為全自動化,從而減少了人工干預,使得Hadoop的部署變得更加簡單,也不容易出錯。
“很多中國企業的CIO認為,大數據解決方案是有價值的,但實施起來確實有許多困難。”戴爾全球副總裁、中國區大型企業及公共事業部總經理容永康舉例說,“國內懂得在Hadoop上進行開發的專業技術人員非常少。一些金融行業的用戶很想現在就部署大數據解決方案,但是苦于找不到既懂Hadoop技術,又懂得金融業務的專業人才。”
Informatica首席技術官James Markarian表示:“在IT環境中,Hadoop不可能作為一個孤島存在。為了讓Hadoop跨越不同平臺,用戶需要將Hadoop作為其IT大環境中的一部分來管理,并通過Hadoop重復使用他們的開發技巧、資產及數據,同時還要統籌管理全部數據。”
在美國市場上,70%的大數據應用處理的還是結構化的數據。從技術的角度看,雖然Hadoop也能處理結構化的數據,但是目前基于Hadoop的大數據分析解決方案主要還是用于處理非結構化的數據。因此,用戶處理結構化數據和非結構化數據通常是用兩套不同的分析工具。這種混合的大數據處理模式是一種普遍現象。
從未來的發展看,非結構化數據的快速增長是大數據分析的主要驅動因素。從這個角度講,Hadoop的應用前景還是十分廣闊的。
各行各業都能用得上大數據,只是對大數據重要性的意識程度不同:凱捷咨詢(Capgemini)的調研結果顯示,76%能源和自然資源行業的高管相信公司是數據驅動的,在醫療醫藥行業和生物科技行業這個數字為75%,在金融行業為73%。包括英特爾在內的有能力提供大數據解決方案的IT廠商正在努力讓各行各業的企業切實感受到大數據的魔力。
能否置身事外?
隨著網絡應用和多媒體應用的興起,互聯網成為大數據的主要來源。隨之而產生的網絡營銷調整圍繞大數據而展開。淘寶是國內公認的對用戶數據利用得較好的公司——淘寶網利用大數據統計分析得到諸如“歐洲杯的球隊勝負如何影響各隊球衣的銷量?花露水的最佳搭配是電蚊拍還是痱子粉?”等問題的有趣結果,并以此為依據來更好地調整營銷戰略。
近日,阿里巴巴集團宣布,將在集團管理層面設立首席數據官崗位(Chief Data Officer),負責全面推進阿里巴巴集團成為“數據分享平臺”的戰略。這直接證明了大數據對于互聯網企業的意義。
別的行業能不能對大數據冷眼旁觀呢?賽迪智庫軟件與信息服務業研究所研究員安暉認為,雖然目前大數據的主要來源是互聯網,但許多以信息流作為核心競爭力,如金融、電信、零售等行業的機構或企業,其數據量也不容低估。例如,美國國家海洋和大氣管理局(NOAA)數據中心存儲的數據超過20PB,沃爾瑪數據中心的存儲能力超過4PB,eBay分析平臺每天處理的數據量高達100PB。并且,由于這些機構和企業所存儲的數據更加有針對性,其數據的價值密度更高,進行大數據處理的意義更強,運用大數據的需求也更為迫切。
安暉以數個典型行業為例來說明大數據能帶來什么好處——電信行業可以從龐大的數據中分析出不同群體的差異化需求,實現套餐制定等精準營銷;制造行業可以通過整合來自研發、工程和制造部門的數據以實行并行工程,顯著縮短產品上市時間并提高質量;交通行業可以通過整合和處理相關數據,實現智能交通(管理)與高效物流調度。
賽迪顧問軟件與信息服務業研究中心研究總監胡小鵬認為,金融行業中證券、信用卡、電子支付等數據規模龐大,具有使用對象多樣化、信息可靠性、實時性、保密性要求高等特點;電信行業中大數據主要體現為電信業務系統產業的計費賬務數據和用戶信息(包括客戶資料、客戶服務數據等),不僅數據量大,而且保存時間長;能源行業大數據主要集中在石油勘探以及電力生產、經營、管理等數據,具有數據量大、分散、類型復雜等特點。其中,在金融行業,利用大數據的挖掘和分析改善用戶體驗、監督欺詐行為、驗證合規性、服務創新等,從而助力金融智能決策,提升競爭力;而對于電力行業,大數據分析有利于電網安全高效運行(安全檢測與控制、災難預警與處理、供電與電力調度決策支持和負荷預測)、電力營銷(用戶用電行為分析)、集團集中管控與精細化管理等。
大數據這場盛宴上,哪個行業也不愿意沒有一席之地。
誰能站出來?
大數據的熱度可以由英特爾、IBM、EMC、惠普等廠商紛紛推出面向大數據的一體化產品和解決方案直接反映出來。
然而,一個不能逃避的現實是,雖然越來越多的行業用戶嘗試應用大數據的解決方案,但是大多數行業用戶對于大數據的認知仍然比較有限。面對林林總總的不同廠商提供的大數據解決方案,用戶分不清這些解決方案的差異在哪里,也就不會真正了解哪種解決方案適合自己。
有用戶反映,大數據解決方案容易給人的錯覺是該解決方案就是把數據分布存儲,再并行處理。即使采用國外廠商的工具,這些工具成熟度不是特別高,導致解決實際問題的時間過長。
英特爾相關專家表示,從總體上看,中國大數據市場發展迅速,特征明顯,相關技術和應用可改進和提升的空間巨大。而且大數據要落地,必須實現包括芯片商、軟件企業等在內的IT基礎設施與服務層平臺的開放。
英特爾在硬件上的領先無需多言。在軟件層面,考慮到Hadoop的開源特性,很多廠商都有機會在Hadoop的基礎上推出產品,但行業解決方案提供商面臨的一個苦惱是,他們不得不進行底層開發。實際上,底層解決方案是有很多共性的。對行業解決方案提供商來說,如果有一個由可靠廠商優化過的平臺再好不過了。利用這個平臺,行業解決方案提供商可以拋開重復的、無意義的勞動,將注意力和精力更加集中在行業特點上,進而開發出滿足行業所需的實打實的行業解決方案。在這種情況下,英特爾適時地推出了英特爾Hadoop發行版,打造一個優秀的、高價值的底層平臺。
對于如何從大數據中發掘價值,英特爾指出,這需要在IT基礎設施與服務層、數據組織與管理層、數據分析與發現層、決策支持與IT服務層全面引入新的技術,特別是在堪稱大數據應用“載體”的IT基礎設施與服務層,采用基于開放架構的平臺將是最佳選擇。
O‘Reilly Strata和Open Source Convention大會委員會主席Edd Dumbill曾指出,使大數據真正變得強大的方式之一就是讓上層程序員可以將精力放在數據而非底層Hadoop設施的抽象特征上。他們編寫更簡短的程序,能夠更清晰地表達出對數據所做的處理。這些將有助于為非程序員創建更好的工具。
延伸到企業層面,“行業解決方案提供商需要穩定性和可用性都足夠好的平臺。在這樣的平臺上,行業解決方案提供商可以從不必要的重復性勞動中解放出來,從而把更多的精力放在提供差異化特色方案和服務上。”英特爾亞太研發有限公司總經理、英特爾軟件與服務事業部中國區總經理何京翔的看法類似。進而,他解讀了英特爾Hadoop發行版的優勢:“英特爾Hadoop發行版的優勢在于:處理接近于實時;能在英特爾平臺上實現最優化的性能,比非英特爾發行版有成倍的增長;通過和電信、智能城市、醫療等行業客戶的合作,英特爾Hadoop還做了更進一步的優化。”
除了提供平臺,英特爾(中國)行業合作與解決方案部中國區總監凌琦強調,英特爾還會把大數據解決方案的研究和服務作為投資部門的重點。英特爾的風險投資部門也對大數據中所涉及的關鍵平臺、關鍵應用、提供商,給予關注。
行業側重點
英特爾硬件平臺的特點讓其可以用“通吃”來形容,行業特色則由軟件來體現。
在云計算、大數據時代,企業更需要以互聯網的思維方式構建面向未來的分布式應用,這就需要一個全新的技術架構。從這個角度說,FusionCube融合一體機解決方案與面向大數據應用的SAP HANA相得益彰。
“SAP HANA是一個能夠充分挖掘和體現大數據價值的解決方案。與傳統的數據分析、商業智能解決方案不同,SAP HANA提供了一整套模型和工具,可以通過對大數據的分析預測未來的業務發展,給企業帶來新的商機。”任志鵬分析說,“針對SAP HANA,華為提供了一個創新的技術平臺FusionCube,將計算、存儲、網絡有機地結合在一起,并融合了華為分布式存儲引擎以及云管理軟件,使得大數據的實時分析與處理可以達到更高的水平。”在TPC-H測試中,華為FusionCube 刷新了基于Sybase IQ的集群性能世界記錄,充分展示了其融合架構帶來的性能優勢。
大規模定制是云計算、大數據時代的一個典型特征。許多企業客戶都需要廠商提供基于其個性化需求定制的解決方案。今天,針對不同企業的不同需求,華為提供了支持單節點HANA的RH5885方案和多節點HANA的FusionCube方案。任志鵬介紹說:“SAP HANA對基礎設施有很嚴格的要求。華為FusionCube for HANA一體機具備更快的同步寫性能、更低延時和更高的讀寫帶寬,以及很好的線性擴展能力。FusionCube可實現一站式交付、家電化安裝,并能按需靈活擴展應用,運維非常簡單。”
華為FusionCube for HANA一體機已經在許多行業得到了應用。以金融行業為例,FusionCube for HANA在包括銀行小微貸項目等在內的新興業務中得到了成功應用。華為內部還成立了一支技術團隊,專門負責支持SAP HANA。
交付“三位一體”
華為進軍IT領域后始終堅持“被集成”的策略。因此在IT解決方案的推廣過程中,華為與集成商、分銷商一直保持緊密合作。華為FusionCube for HANA一體機就是通過富通集團在中國市場上進行銷售的。“華為、SAP與富通集團基于FusionCube for HANA實現了三位一體的交付。”任志鵬表示。
盡管當前很多企業都在積極采用大數據分析技術和解決方案來變革業務模式,提升企業的核心競爭力,但是很多企業都對自身的大數據項目并不滿意。全球領先的基準研究和咨詢機構Ventana Research的研究@示,79%的企業用戶不具備運用高級分析技術的必備技能。
姜欣介紹,今年Teradata通過《經濟學人》雜志在全球所做的一個調研結果顯示,在大數據利用方面,企業主要存在以下三方面問題:第一,數據整合問題,57%的被訪企業認為難以獲取重要的業務數據;第二,數據應用問題,42%的受訪企業認為數據過于繁雜,應用不夠友好;第三,數據治理問題,75%的受訪企業為因異構數據而浪費時間感到困擾。
“我們目前推出的解決方案和技術,就是為了解決以上三方面問題。”姜欣介紹說,為此Teradata提出了五級轉型戰略:
其一,堅定地走一體化數據分析平臺的道路,不斷完善一系列平臺產品,其中包括最近推出的Teradata IntelliFlex數據倉庫架構和Teradata Aster大數據探索平臺
其二,全面向云轉型,支持私有云、公有云和托管云等多種部署方式,并在這種云生態下提供咨詢和開發部署服務。
其三,打造分析生態系統,將統一數據架構(UDA),以及Unity、QueryGrid和Listener等工具整合起來,形成一個大數據生態,并在這個生態下提供咨詢和實施服務。
其四,從完全技術中立的角度為客戶提供大數據咨詢服務,如大數據戰略規劃服務、敏捷開發咨詢服務、數據建模服務。
其五,堅持客戶至上而非產品至上,用多元化的產品全面滿足客戶需求,幫助客戶挖據數據價值。
由此可見,Teradata在大數據領域,除了不斷完善產品和技術以外,還不斷強化咨詢服務能力。
推出無邊界分析功能
作為Teradata多年的老客戶,瑞典最大的工業企業集團沃爾沃汽車公司從2006年開始建立數據分析平臺。一直以來,沃爾沃汽車公司面臨的一個問題,就是數據散布在超過30個系統中。公司的整合數據存儲庫和數據模型中,除了有客戶、經銷商、車輛與車輛配置信息、質保和故障診斷等數據外,還有很多外部數據。這些數據有結構化數據,也有非結構化數據。
沃爾沃汽車公司亟須一個彈性好、敏捷性高的平臺來處理所有這些數據。為此,沃爾沃汽車公司部署了Teradata統一數據架構,將所有需要處理的數據全部整合起來進行處理,從而解決數據孤島和數據治理混亂問題。在部署了Teradata統一數據架構后,沃爾沃汽車公司構建了全球統一的敏捷的數據驅動環境,從而可以借助可靠的數據分析結果降低運營成本,提高盈利能力和客戶滿意度;形成基于事實的決策機制和文化,使得公司更加開放和透明;有效支撐“數據創客”活動,員工和合作伙伴可以基于數據平臺開發數據產品。
沃爾沃汽車公司成功應用Teradata統一數據架構的案例,是Teradata新推出的無邊界分析功能的一個應用典范。據悉,Teradata無邊界分析打破了過去在進行數據分析時單一系統、單一技術分析的界限,突破時間、地點,以及所需數據和平臺的限制,幫助企業高效完成數據分析工作。
Teradata無邊界分析功能通過最新版本的Teradata QueryGrid軟件和可以自動協調多系統Teradata環境的Teradata Unity軟件來實現。其中,Teradata Unity軟件具有高可用性特點和工作負載分配功能,從而確保用戶在權限范圍內可隨時訪問相關數據和分析。全新升級的Teradata Unity具有強大的跨系統功能,可進一步消除分析環境界限。
電子專業制造服務公司偉創力公司數據與分析團隊主管森迪爾(Sendil Thangavelu)認為,采用多個分析引擎來分析來自多個數據存儲庫的數據以獲得更全面、可視化的分析結果,將成為企業強化競爭優勢的重要因素。“我們的Teradata數據管理環境已經非常卓越,但我們一直還在尋找解決方案來提高我們的能力。Teradata的無邊界分析概念與我們的企業發展方向不謀而合。”森迪爾補充說。
推出快速分析咨詢服務
姜欣告訴記者,2015年年底,Teradata總結出了在新形勢下具有較強競爭力的新型企業――技術感知型企業。技術感知型企業應具有敏捷平臺、行為分析、協同思維、自助應用和自動決策五大核心能力。
姜欣表示,技術感知型企業對內能夠提供數據洞察能力,實現數據驅動流程,提升運營的ROI;對外可以整合數據價值,創新數據盈利模式,實現信息運營。
但是,成為技術感知型企業并不容易。為了幫助客戶更加順利、快速地成為技術感知型企業,Teradata還推出了Teradata RACE(快速分析咨詢服務)和Teradata業務價值框架。據介紹,RACE是一套敏捷、技術中立的方法論,能夠幫助客戶在正式投資前了解分析解決方案的潛在業務價值。不僅如此,借助豐富的行業經驗和專業的數據分析技術,Teradata還可以幫助客戶將項目實施所需時間從數月縮短至6~10周。
據悉,作為Teradata RACE服務的核心,Teradata業務價值框架是Teradata從數千次與客戶成功合作中積累的豐富經驗的結晶。該框架通過發現切實有用的分析解決方案,幫助客戶更快地從分析和數據技術投資中獲取回報。
值得一提的是,隨著物聯網傳感器數據等新型數據源的不斷出現,新分析技術的不斷涌現,用戶部署和應用分析解決方案的難度越來越大。但依托適用Teradata業務價值框架詳盡的可視化信息,接受RACE服務的客戶可以在實施分析解決方案時,掌握清晰的路線圖,了解該項目在何時、以怎樣的方式帶來投資回報。
姜欣介紹,RACE方法包含三個主要階段:
第一階段,溝通(Align)。Teradata的分析業務咨詢顧問以業務價值框架作為出發點,幫助客戶發現最具潛在價值的業務案例,并對準該業務案例開展工作,確認支持該使用案例關鍵數據資產的可用性。
第二階段,創建(Create)。Teradata的數據科學家為選中的業務案例載入并準備數據,開發新分析模型或調整既有模型。本階段數據科學家會與業務發起人對方案進行多次快速迭代,以確保分析結果能帶來預期業務效果。
第三階段,評估(Evaluate)。Teradata的分析業務咨詢顧問分析結果,評估部署分析使用案例的潛在投資回報率,并為客戶設計、部署方案。
收購加速能力提升
在IT界,一直以來都不乏通過對具有先進技術的公司的收購,來迅速提升本公司能力的案例,對于以往以PC等終端設備見長的戴爾來說,要想轉型進軍企業級市場,收購無疑是一條快速實現目標的捷徑。從2008年開始,戴爾就將目光投向了在存儲、網絡、安全、軟件、服務等領域有特色的廠商,開始了有計劃、有步驟的收購行動。
至今,戴爾已經收購了20多家廠商,其中不少很成功的收購為業界所津津樂道。例如對存儲廠商EqualLogic的收購,兩年時間就使其業績達到10億美元,而用戶數增加了8倍;2010年年底收購的智能存儲廠商Compellent,使戴爾的存儲解決方案上了一個臺階,Compellent的“流動數據”理念現在已經成為戴爾存儲的設計理念;對咨詢服務廠商佩羅的收購更是填補了戴爾企業級咨詢服務的空白,使戴爾的解決方案成為名副其實的“端到端”,并有效地帶動了戴爾其他產品線的銷售。
正是這一次次的收購,使戴爾迅速轉型,業績不斷提升,在當今云計算和大數據時代,也有了更多的話語權。戴爾全球企業解決方案事業部副總裁Cheryl Cook認為,戴爾在大數據方面擁有創新性的解決方案,不僅可以為用戶節省大筆資金,同時可提供極高的價值。她認為,大數據從開始到成熟分為5個階段,即從混亂、保留、優化到簡單分析、復雜分析。在這5個階段里,戴爾針對前3個階段,可提供大數據保留解決方案;而對于后兩個階段,戴爾則擁有大數據分析解決方案。Cheryl Cook認為,戴爾創新性的解決方案可處理成熟度模型范圍內的結構化、半結構化和非結構化內容,她特別說道,戴爾將利用Hadoop,并與從事Hadoop開發的Cloudera公司合作,為用戶提供大數據分析解決方案;而在大數據保留解決方案中,戴爾將充分發揮在存儲方面的優勢,通過存儲虛擬化和整合、應用程序優化、數據保護、災難恢復以及數據保留和管理等技術,為“流動的數據”提供存儲和保護。
深諳用戶需求
在戴爾2012年高層客戶峰會上,戴爾服務部首席創新官James Stikeleather就“IT的未來”進行了演講,他認為,企業IT未來將面臨著來自IT價值、所有權和角色等方面的五大根本性變化,這些變化包括:信息超越流程、IT嵌入在業務服務之中、外部化的服務交付、企業合作伙伴的責任更大、減弱的獨立IT角色。
作為IT解決方案供應商,戴爾同樣也是一家企業,James Stikeleather認為,在當今這個轉型的時代,戴爾已經成功地轉型成為高效企業,它將戰略性支出從2008年占IT預算的20%提高到今天的52%。這期間,戴爾的IT經過了標準化、簡化、自動化,并最終實現云,比如將97%的系統遷移到x86平臺;大力推進虛擬化,從而減少了6000臺服務器;僅用一個控制臺就可管理13萬臺服務器和客戶端;運用云平臺聆聽客戶的聲音、信息和進行交互。這些舉措使戴爾更加了解用戶,更有針對性地為用戶提供適合的解決方案,真正解決用戶的問題。
產品與方案:
集聚業界最強資源
正如很多業內專家所說的那樣,存儲和安全是大數據迫切需要考慮的首要問題。
從海量數據產生的角度,以前數據量都是以GB或者TB記的量級。但如今,情況發生了改變,過去可能多年才能累計產生的數據量,現在可能只用很短時間就會積累起來,一些單位每年產生的數據量就可能達到幾十TB,甚至不久的將來就會升級到PB級的數據量,將會占用越來越多的存儲空間。
在解決海量數據的存儲問題的同時,企業還必須要解決數據的安全性和可靠性等問題。所謂數據的安全性是指數據在任何情況下的可訪問性,不會因為人為或自然的因素導致數據不可訪問;數據的可靠性意味著即便是在極端情況下,數據發生損壞或丟失,仍有數據可被恢復或直接訪問。
顯然,解決這些問題必須要靠質量過硬的產品與解決方案。為此,長虹佳華近年來持續在云計算安全和大數據方面進行探索和投入,并且取得了很大成果:
在產品方面,長虹佳華以存儲和服務器類產品為主,涵蓋HDS、博科、昆騰、EMC、IBM等十余家全球知名、領先的數據存儲業務服務商;在解決方案方面,長虹佳華幫助商為多種特定的行業用戶提供行業解決方案,并且可以針對用戶的不同需求提供定制化的解決方案,從而更加凸顯了長虹佳華的綜合實力;
在服務方面,長虹佳華并不僅僅重視售后服務,而是為用戶提供包括培訓、環境測試、技術支持在內的售前、售中、售后的一站式服務。以存儲產品為主導構建增值業務群,如今已成為長虹佳華的既定戰略。
近幾年來,長虹佳華在原有合作伙伴的基礎上,進一步與賽門鐵克、Radware、博世、邁普等國內外知名品牌緊密合作,集聚了強大的產品與解決方案資源,整體解決方案能力和產品組合能力大大增強,進一步提升了長虹佳華“以數據為核心”的增值分銷業務的服務能力。
CDSClub與云計算體驗
暨培訓中心:為數據安家
CDSClub與云計算體驗暨培訓中心,一直是長虹佳華享譽存儲分銷行業的代表之作。CDSClub一方面從技術整合出發,另一方面從渠道伙伴支持出發,兩者相結合,就為大數據的應用與銷售安下了最好的“家”。
CDSClub是從長虹佳華成功運作數年的SANClub升級而來,其主要功能是給特定的行業提供定制化的數據方案。升級后的CDSClub并不是僅僅局限于SAN架構一種主流技術,而是實現了跨平臺的技術整合,使最終的數據方案更貼近實際應用,服務更統一,并且更有針對性。同時,方案的適用性也得到了極大提高。
目前處于國內領先地位的長虹佳華云計算體驗暨培訓中心,為渠道合作伙伴的數據方案、系統集成提供了演示、測試的廣闊平臺,對于渠道合作伙伴需要的不同產品組合應用測試、各類定制方案演示等都可輕松實現,是對渠道技術需求的極大補充支持。同時,該中心還充當起長虹佳華對合作伙伴及行業客戶進行技術培訓、資質認證以及設備服務的支持平臺角色。
大數據浪潮正洶涌來襲,與互聯網領域其他變革一樣,這絕不僅僅是一場信息技術領域的革命,更是在全球范圍內加速企業創新、引領社會變革的利器。現代管理學之父德魯克有言:預測未來最好的方法,就是去創造未來。瞄準大數據的存儲業務,長虹佳華正在向最強營銷服務提供商邁進……
分銷業務業績驕人
大數據主要包括大交易數據、大交互數據和大數據處理。數據集成的功能是收集數據、探查數據和集中管理數據,從而進一步提高數據的質量。Informatica的數據集成軟件可以辨別哪些數據是合規的,并提取出來,實施統一管理和統一復制。Informatica公司高級副總裁兼首席信息官托尼·楊(Tony Young)表示,針對Hadoop大數據處理平臺,Informatica的數據集成軟件主要負責做好以下幾件事:解析和準備數據,探查和發現數據,轉換和清洗數據,監控Hadoop平臺中的數據。隨著云計算應用的逐漸普及,數據碎片日益增加,而移動計算、社交計算的快速發展也增加了數據訪問和管理的復雜性。在這種情況下,保證數據的合規性、一致性和準確性就顯得尤為重要。數據集成不僅可以輕松實現上述目標,而且可以在數據整個生命周期的管理中起到監督和調整的作用。
在數據管理產品趨向融合的今天,數據集成軟件會不會也被集成到一些綜合性的管理解決方案中呢?
托尼·楊表示:“Informatica之所以能夠保持快速成長,一個關鍵的因素就是始終保持中立的地位。我們的數據集成軟件可以與其他所有應用和管理軟件平臺相集成,比如微軟、SAP等廠商的產品。”
大數據促進業務增長
“數據分析是今后企業在競爭中保持優勢的一個主要手段。如果你現在不認真對待大數據,那么競爭對手就有可能超過你,并取代你。”托尼·楊表示,“大數據與SOA(面向服務的體系結構)不同。SOA不能直接給企業帶來商業價值,而大數據與企業的業務績效直接相關。企業的CIO必須重視大數據的處理與應用。”
一項由惠普主導的調查表明,亞太地區60%的受訪企業表示今年將把至少10%的IT創新預算用于大數據,而在中國這一數字為56%。三分之一的亞太地區和中國受訪企業還堅信,大數據是其最大的差異化競爭優勢。然而,調查卻發現,近一半的亞太地區受訪企業所實施的大數據計劃都失敗了,而在中國,這一數字為55%。很顯然,大數據中蘊含著巨大的商業價值,然而駕馭大數據不是一件容易的事,并不是所有企業都具備像Google一樣“玩轉”數據的基因與技術儲備。許多行業除了需要做好大數據思維上的轉變之外,還需要有不同工具來進行大數據的處理與分析。
通過對收購的Vertica、Autonomy、ArcSight等產品進行優化整合,惠普在融入Hadoop等大數據技術的基礎上打造了大數據分析平臺HAVEn。“HAVEn平臺提供了大量的應用開發接口(API),惠普希望通過HAVEn與合作伙伴共同打造一套完整的大數據分析生態系統,讓更多應用解決方案落地到行業。它可以充分利用惠普的分析軟件、硬件和服務,創建新一代為大數據準備的分析應用和解決方案。” 惠普公司軟件集團大中華區總經理于志偉表示,“同時,HAVEn平臺還支持各種主流硬件平臺,為客戶提供最佳的投資回報(Return On Investment)與信息回報(Return On Information)。”
不只是軟件平臺