国产A级毛片国产精品交换_日韩午夜福利网址_国产精品自产拍在线蜜浪潮_午夜成福利片一区二区三三_加勒比视频在线播放_亚洲AⅤ无码一级毛片一夜妓_欧美日本国产在线不卡_亚洲超清无码中文字幕_91精品社区亚洲_三级片污在线观看

資訊默認廣告
當前位置:首頁(yè) » 資訊中心 » 媒體報道 » 大數據分析重大 分析策略選擇需慎重

大數據分析重大 分析策略選擇需慎重

文章出處:網(wǎng)責任編輯:作者:人氣:-發(fā)表時(shí)間:2015-07-15 11:28:00

 大數據分析依靠機器學(xué)習和大規模計算,對規模巨大的數據進(jìn)行分析。作為時(shí)下最火熱的IT行業(yè)的詞匯,數據倉庫、數據安全、數據分析、數據挖掘等等圍繞大數據的商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭相追捧的利潤焦點(diǎn)。大數據時(shí)代的來(lái)臨,大數據分析應運而生。

    安聯(lián)全球救援長(cháng)期從事道路救援已有12年,利用大數據分析科學(xué)分析救援數據,在第一時(shí)間內合理調配救援資源,并在最短時(shí)間內通知相關(guān)部門(mén)展開(kāi)對應的援助。2015年7月6日,安聯(lián)全球救援在北京慶祝在華第500萬(wàn)個(gè)成功道路救援案例誕生。在過(guò)去的12年里,安聯(lián)全球救援投入了大量資金和資源在全國范圍內建立專(zhuān)業(yè)服務(wù)網(wǎng)絡(luò ),并分別在北京和成都設立運營(yíng)中心,其網(wǎng)絡(luò )覆蓋全國1762個(gè)城市,平均服務(wù)到達時(shí)間為39分鐘。利用大數據分析,大大提高了道路救援效率。

sad

    那么大數據分析究竟是怎么樣?那些方法更有效?我們該如何利用起來(lái)呢?

    大數據分析可以分為五個(gè)基本方面:

    1.可視化分析(AnalyticVisualizations)——不管是對數據分析專(zhuān)家還是普通用戶(hù),數據可視化是數據分析工具最基本的要求??梢暬梢灾庇^(guān)的展示數據,讓數據自己說(shuō)話(huà),讓觀(guān)眾聽(tīng)到結果。

    2.數據挖掘算法(DataMiningAlgorithms)——可視化是給人看的,數據挖掘就是給機器看的。集群、分割、孤立點(diǎn)分析還有其他的算法讓我們深入數據內部,挖掘價(jià)值。這些算法不僅要處理大數據的量,也要處理大數據的速度。

    3.預測性分析能力(PredictiveAnalyticCapabilities)——數據挖掘可以讓分析員更好的理解數據,而預測性分析可以讓分析員根據可視化分析和數據挖掘的結果做出一些預測性的判斷。

    4.義引擎(SemanticEngines)——我們知道由于非結構化數據的多樣性帶來(lái)了數據分析的新的挑戰,我們需要一系列的工具去解析,提取,分析數據。語(yǔ)義引擎需要被設計成能夠從“文檔”中智能提取信息。

    5.數據質(zhì)量和數據管理(DataQualityandMasterDataManagement)——數據質(zhì)量和數據管理是一些管理方面的最佳實(shí)踐。通過(guò)標準化的流程和工具對數據進(jìn)行處理可以保證一個(gè)預先定義好的高質(zhì)量的分析結果。

    大數據分析方法的選擇

    大數據分析性能的好壞,也就是說(shuō)機器學(xué)習預測的準確率,與使用的學(xué)習算法、問(wèn)題的性質(zhì)、數據集的特性包括數據規模、數據特征等都有關(guān)系。一般地,Ensemble方法包括RandomForest和AdaBoost、SVM、LogisticRegression分類(lèi)準確率最高。沒(méi)有一種方法可以“包打天下”。RandomForest、SVM等方法一般性能最好,但不是在什么條件下性能都最好。

    不同的方法,當數據規模小的時(shí)候,性能往往有較大差異,但當數據規模增大時(shí),性能都會(huì )逐漸提升且差異逐漸減小。也就是說(shuō),在大數據條件下,什么方法都能work的不錯。對于簡(jiǎn)單問(wèn)題,RandomForest、SVM等方法基本可行,但是對于復雜問(wèn)題,比如語(yǔ)音識別、圖像識別,最近流行的深度學(xué)習方法往往效果更好。深度學(xué)習本質(zhì)是復雜模型學(xué)習,是今后研究的重點(diǎn)。

    在實(shí)際應用中,要提高分類(lèi)的準確率,選擇特征比選擇算法更重要。好的特征會(huì )帶來(lái)更好的分類(lèi)結果,而好的特征的提取需要對問(wèn)題的深入理解。

    大數據分析策略分析

    建立大數據分析平臺時(shí),選擇實(shí)現若干種有代表性的方法即可。當然,不僅要考慮預測的準確率,還有考慮學(xué)習效率、開(kāi)發(fā)成本、模型可讀性等其他因素。大數據分析平臺固然重要,同時(shí)需要有一批能夠深入理解應用問(wèn)題,自如使用分析工具的工程師和分析人員。

    只有善工利器,大數據分析才能真正發(fā)揮威力

?

此文關(guān)鍵字:大數據.分析重大分析.策略.擇需慎重

相關(guān)資訊

推薦商品