大數據需要知道的幾個(gè)冷知識
大數據的隱秘魅力就在于,他比你都了解你。你以為你每次按下手機按鍵的動(dòng)作都是一樣的嗎?哈哈圖樣圖森破。
來(lái)自今日頭條的技術(shù)副總裁楊震原告訴童鞋們,他們正在測試的“黑科技”,恰恰能從你點(diǎn)擊按鍵的時(shí)間和手指面積,推測出你當時(shí)的情緒。你的漫不經(jīng)心、憤怒或者感動(dòng),都能夠成為后臺為你推送何種消息的依據。未來(lái),如下場(chǎng)景可期:
如果你正處在被女神甩掉的悲傷中,也許客戶(hù)端會(huì )為你推送——搞基的一百種好處。如果你正處在領(lǐng)到本月工資飄飄欲仙的快樂(lè )中,也許客戶(hù)端會(huì )為你推送——在北京月兩萬(wàn)何時(shí)能買(mǎi)一個(gè)廁所?
那么這種“恰到好處“的情緒拿捏和大數據有什么關(guān)系呢?實(shí)際上對你情緒的推測是建立在對你多次正常點(diǎn)擊的記錄之上的。這種行為數據甚至在你還未意識到的時(shí)候,就“出賣(mài)”了你的情緒。
今日頭條技術(shù)副總裁楊震原在分析一個(gè)按鈕的平均觸摸時(shí)間
你的“姿勢”,才是真的大數據
銀行每天的交易賬目流水的統計數據,并不是大數據,而每個(gè)用戶(hù)在拿號之后等待了多久才排到,有多少用戶(hù)罵娘,有多少用戶(hù)過(guò)于焦急憤而離去,這些真正的行為才是大數據。
楊震原又舉了今日頭條在應用中的另一個(gè)例子。
實(shí)際上,你在一篇文章的什么位置停留多久,然后劃動(dòng)了多遠,在新的位置停留了多久,是否看了評論,看了幾條評論,都可以按順序被記錄下來(lái)。接下來(lái)就是通過(guò)算法評估讀者的興趣所在。
CSDN創(chuàng )始人蔣濤也特別提到,美國電商平臺Wish正是用大數據的方法,根據每個(gè)人的數據不同,“看人下菜碟”地推薦你可能喜歡的貨品,三年時(shí)間已經(jīng)發(fā)展成北美最大的電商之一。
所以,一個(gè)悲傷的消息是:未來(lái)如果你要隱藏自己的身份,不僅僅要變裝易容偽造指紋,甚至連點(diǎn)擊手機,查看文章的習慣都要改變了。
大數據就是:一個(gè)都不能少
如果要想知道有多大比例的人喜歡GV,那么只需要做好抽樣調查就可以了,沒(méi)有必要對所有人進(jìn)行調查。但是如果你想要推銷(xiāo)宅腐的周邊智能硬件產(chǎn)品,則需要逐個(gè)排查每個(gè)人“獨特”的興趣愛(ài)好。
所有數據一個(gè)都不能少,這就是所謂的“全量加工”,這些數據的制造者正是各大廠(chǎng)商利潤的源泉。
360商業(yè)產(chǎn)品首席架構師劉鵬是一名網(wǎng)紅,他在很多場(chǎng)合都強調:全量加工才是大數據。他說(shuō),涉及到個(gè)性化推薦、計算廣告、個(gè)人征信這些場(chǎng)景,大規模的計算就是無(wú)法避免的。
從技術(shù)角度來(lái)說(shuō),之所以大數據可以做到這么精準,也主要得益于技術(shù)的進(jìn)步。感知設備被豐富地用在五花八門(mén)的硬件上,使得以前無(wú)法記錄的數據,現在都可以被記錄了。
大數據不應該給人用
大數據應該交給機器做決策,而不是交給人做決策。
這種洋溢著(zhù)對人類(lèi)深深不信任感的論斷同樣來(lái)自于劉鵬。在他眼中,大數據是為機器提供的食糧。而能夠駕馭大數據的人類(lèi)基本只有兩種:數據科學(xué)家和統計工作者。
IT企業(yè)中養一群科學(xué)家的可能性為零。而人類(lèi)的判斷往往基于宏觀(guān)、戰略,不可能有精力做到“因事而異”。相比之下機器的判斷比人類(lèi)更加細致。比如為每個(gè)用戶(hù)比如畫(huà)像、貼標簽。所以,要想把大數據利用透徹,愚蠢的人類(lèi)還是暫時(shí)靠邊站吧。
“有點(diǎn)錯誤”的大數據更好用
“數據”這兩個(gè)字,天然給人一種完美而且精準的感覺(jué)。在這方面,大數據要挑戰你的底線(xiàn)。作為數字廣告領(lǐng)域的大牛,劉鵬強調,大數據可以存在半一致性這樣模棱兩可的屬性。換句話(huà)說(shuō),允許數據錯誤和丟失。
納尼?錯誤的數據也是好數據嗎?沒(méi)錯。由于數據量巨大,而且分析半天往往沒(méi)什么有用的收獲(價(jià)值密度低),分析者往往需要選取一些特征數據做加工,而對于這些特征數據,也許還要簡(jiǎn)化之后再加工。所以最終大數據要達到的結果是難得糊涂,卻一針見(jiàn)血。
所以,如果有人向喜愛(ài)人民網(wǎng)的你推薦草榴的時(shí)候,先不要發(fā)火,你可能只是大數據的一個(gè)錯誤罷了。
保險公司最喜歡和大數據在一起
如果你是一個(gè)魯莽的人,最想知道這個(gè)情況的無(wú)疑是你的汽車(chē)保險公司,想必你的保費會(huì )居高不下;如果你是一個(gè)謹小慎微的人,最想知道的也是保險公司,因為它可以用打折的保費吸引你投保。
在你身上,甚至存在一個(gè)精確的“岀險率”數字。這個(gè)聽(tīng)上去很驚悚的數字恰恰是保險公司利潤的來(lái)源。因為不掌握這樣大數據的個(gè)人,是無(wú)法計算自己的岀險率的。保險公司恰恰利用這種信息不對稱(chēng),給一個(gè)岀險率是萬(wàn)分之一的人開(kāi)出了千分之一的保價(jià),相當于賺了十倍的利潤。
隱私問(wèn)題要靠技術(shù)改進(jìn)
數據比它看上去的樣子更險惡,這是大數據業(yè)內人士的普遍共識。即使隱去了你的姓名電話(huà)等等敏感信息,只保留你和其他人聯(lián)系的記錄,熟悉你的人完全可以猜到你的身份。目前大數據的安全性,在他人的惡意之下,顯得力不從心。
隱私問(wèn)題,制度只能解決20分,剩下的80分要靠技術(shù)進(jìn)步來(lái)解決。
劉鵬如是說(shuō)。期待市場(chǎng)倒退到前大數據時(shí)代,似乎沒(méi)有希望了。
如何精確統計出有多少人喜愛(ài)蒼井空,有多少人喜歡武藤蘭,但是又不泄露到底是誰(shuí)喜歡蒼老師,誰(shuí)喜歡武老師,這是目前大數據的最前沿研究。
有關(guān)大數據的政策再?lài)栏?,沒(méi)有一套可靠的保密技術(shù),數據的安全都是無(wú)從談起的。隱私算法、數據脫敏、數據隔離。都是研究的方向。在此之前,各位的大數據還都在相對危險的狀態(tài)。這也是為什么目前法律沒(méi)有禁止數據買(mǎi)賣(mài),而各大巨頭卻不敢將數據出售的原因。當然,大數據庫市場(chǎng)價(jià)目前比較低也是一個(gè)重要的原因。
相關(guān)資訊
- 大數據快步邁進(jìn)實(shí)用門(mén)檻
- 大數據時(shí)代:守好數據安全這道門(mén)
- “互聯(lián)網(wǎng)+”浪潮下的數據中心變革之道
- 盤(pán)點(diǎn)安防大數據應用
- 美國數據科學(xué)家:產(chǎn)業(yè)化的大數據分析如何實(shí)現?
- 物聯(lián)網(wǎng)大數據時(shí)代真的到來(lái)了嗎?
- 大數據時(shí)代下的智能家居行業(yè)發(fā)展趨勢
- 云計算、大數據能為反恐做什么?
- 大數據時(shí)代 安維思為您提供最佳用戶(hù)體驗
- 大數據分析重大 分析策略選擇需慎重
推薦商品
同類(lèi)文章排行
- 視頻應用多元化 以視頻為核心的運營(yíng)服務(wù)興起
- 智能家居不能總是空頭概念 人工智能是最終王者
- 中國家電借智能化彎道超車(chē) 日系廠(chǎng)商節節敗退
- 智能家居走向平民化 還得以家裝為切入口
- 安防百科:什么是視頻帶寬自適應?
- 全面了解CCD攝像機
- 深圳安防產(chǎn)業(yè)如何發(fā)展 智慧創(chuàng )新才能插上翅膀
- 物聯(lián)網(wǎng)技術(shù)將成主流 2016年企業(yè)中使用率將上升50%
- 監獄智能化管理系統綜合安防解決方案
- 農村監控落后 安防發(fā)展契機在哪?
最新資訊文章
- 華安泰亮相2021寶德數字產(chǎn)業(yè)生態(tài)大會(huì )
- AI智慧養老,守護老人健康安全
- 要聞 | 校企合作,共建“智慧校園”
- 華安泰人員定位管理系統
- 華安泰AI視頻分析預警系統吸煙檢測
- 華安泰AI視頻分析預警系統在河道水庫等管制區域的應用
- 華安泰AI視頻分析預警系統助力園區智慧升級
- AI賦能校園新生態(tài) _視頻AI分析預警系統在校園的應用
- 華安泰AI視頻分析預警系統在戶(hù)外公共區域的應用
- 華安泰16周年 | 奮勇前行,不斷超越