大數據分析重大 分析策略選擇需慎重
大數據分析依靠機器學(xué)習和大規模計算,對規模巨大的數據進(jìn)行分析。作為時(shí)下最火熱的IT行業(yè)的詞匯,數據倉庫、數據安全、數據分析、數據挖掘等等圍繞大數據的商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭相追捧的利潤焦點(diǎn)。大數據時(shí)代的來(lái)臨,大數據分析應運而生。
安聯(lián)全球救援長(cháng)期從事道路救援已有12年,利用大數據分析科學(xué)分析救援數據,在第一時(shí)間內合理調配救援資源,并在最短時(shí)間內通知相關(guān)部門(mén)展開(kāi)對應的援助。2015年7月6日,安聯(lián)全球救援在北京慶祝在華第500萬(wàn)個(gè)成功道路救援案例誕生。在過(guò)去的12年里,安聯(lián)全球救援投入了大量資金和資源在全國范圍內建立專(zhuān)業(yè)服務(wù)網(wǎng)絡(luò ),并分別在北京和成都設立運營(yíng)中心,其網(wǎng)絡(luò )覆蓋全國1762個(gè)城市,平均服務(wù)到達時(shí)間為39分鐘。利用大數據分析,大大提高了道路救援效率。
那么大數據分析究竟是怎么樣?那些方法更有效?我們該如何利用起來(lái)呢?
大數據分析可以分為五個(gè)基本方面:
1.可視化分析(AnalyticVisualizations)——不管是對數據分析專(zhuān)家還是普通用戶(hù),數據可視化是數據分析工具最基本的要求??梢暬梢灾庇^(guān)的展示數據,讓數據自己說(shuō)話(huà),讓觀(guān)眾聽(tīng)到結果。
2.數據挖掘算法(DataMiningAlgorithms)——可視化是給人看的,數據挖掘就是給機器看的。集群、分割、孤立點(diǎn)分析還有其他的算法讓我們深入數據內部,挖掘價(jià)值。這些算法不僅要處理大數據的量,也要處理大數據的速度。
3.預測性分析能力(PredictiveAnalyticCapabilities)——數據挖掘可以讓分析員更好的理解數據,而預測性分析可以讓分析員根據可視化分析和數據挖掘的結果做出一些預測性的判斷。
4.義引擎(SemanticEngines)——我們知道由于非結構化數據的多樣性帶來(lái)了數據分析的新的挑戰,我們需要一系列的工具去解析,提取,分析數據。語(yǔ)義引擎需要被設計成能夠從“文檔”中智能提取信息。
5.數據質(zhì)量和數據管理(DataQualityandMasterDataManagement)——數據質(zhì)量和數據管理是一些管理方面的最佳實(shí)踐。通過(guò)標準化的流程和工具對數據進(jìn)行處理可以保證一個(gè)預先定義好的高質(zhì)量的分析結果。
大數據分析方法的選擇
大數據分析性能的好壞,也就是說(shuō)機器學(xué)習預測的準確率,與使用的學(xué)習算法、問(wèn)題的性質(zhì)、數據集的特性包括數據規模、數據特征等都有關(guān)系。一般地,Ensemble方法包括RandomForest和AdaBoost、SVM、LogisticRegression分類(lèi)準確率最高。沒(méi)有一種方法可以“包打天下”。RandomForest、SVM等方法一般性能最好,但不是在什么條件下性能都最好。
不同的方法,當數據規模小的時(shí)候,性能往往有較大差異,但當數據規模增大時(shí),性能都會(huì )逐漸提升且差異逐漸減小。也就是說(shuō),在大數據條件下,什么方法都能work的不錯。對于簡(jiǎn)單問(wèn)題,RandomForest、SVM等方法基本可行,但是對于復雜問(wèn)題,比如語(yǔ)音識別、圖像識別,最近流行的深度學(xué)習方法往往效果更好。深度學(xué)習本質(zhì)是復雜模型學(xué)習,是今后研究的重點(diǎn)。
在實(shí)際應用中,要提高分類(lèi)的準確率,選擇特征比選擇算法更重要。好的特征會(huì )帶來(lái)更好的分類(lèi)結果,而好的特征的提取需要對問(wèn)題的深入理解。
大數據分析策略分析
建立大數據分析平臺時(shí),選擇實(shí)現若干種有代表性的方法即可。當然,不僅要考慮預測的準確率,還有考慮學(xué)習效率、開(kāi)發(fā)成本、模型可讀性等其他因素。大數據分析平臺固然重要,同時(shí)需要有一批能夠深入理解應用問(wèn)題,自如使用分析工具的工程師和分析人員。
只有善工利器,大數據分析才能真正發(fā)揮威力
?
相關(guān)資訊
推薦商品
同類(lèi)文章排行
- 視頻應用多元化 以視頻為核心的運營(yíng)服務(wù)興起
- 智能家居不能總是空頭概念 人工智能是最終王者
- 中國家電借智能化彎道超車(chē) 日系廠(chǎng)商節節敗退
- 智能家居走向平民化 還得以家裝為切入口
- 安防百科:什么是視頻帶寬自適應?
- 全面了解CCD攝像機
- 深圳安防產(chǎn)業(yè)如何發(fā)展 智慧創(chuàng )新才能插上翅膀
- 物聯(lián)網(wǎng)技術(shù)將成主流 2016年企業(yè)中使用率將上升50%
- 監獄智能化管理系統綜合安防解決方案
- 農村監控落后 安防發(fā)展契機在哪?
最新資訊文章
- 華安泰亮相2021寶德數字產(chǎn)業(yè)生態(tài)大會(huì )
- AI智慧養老,守護老人健康安全
- 要聞 | 校企合作,共建“智慧校園”
- 華安泰人員定位管理系統
- 華安泰AI視頻分析預警系統吸煙檢測
- 華安泰AI視頻分析預警系統在河道水庫等管制區域的應用
- 華安泰AI視頻分析預警系統助力園區智慧升級
- AI賦能校園新生態(tài) _視頻AI分析預警系統在校園的應用
- 華安泰AI視頻分析預警系統在戶(hù)外公共區域的應用
- 華安泰16周年 | 奮勇前行,不斷超越