国产A级毛片国产精品交换_日韩午夜福利网址_国产精品自产拍在线蜜浪潮_午夜成福利片一区二区三三_加勒比视频在线播放_亚洲AⅤ无码一级毛片一夜妓_欧美日本国产在线不卡_亚洲超清无码中文字幕_91精品社区亚洲_三级片污在线观看

資訊默認廣告
當前位置:首頁(yè) » 資訊中心 » 媒體報道 » 大數據需要知道的幾個(gè)冷知識

大數據需要知道的幾個(gè)冷知識

文章出處:雷鋒網(wǎng)網(wǎng)責任編輯:華安泰作者:VIKOR人氣:-發(fā)表時(shí)間:2015-11-24 15:19:00

  大數據的隱秘魅力就在于,他比你都了解你。你以為你每次按下手機按鍵的動(dòng)作都是一樣的嗎?哈哈圖樣圖森破。

    來(lái)自今日頭條的技術(shù)副總裁楊震原告訴童鞋們,他們正在測試的“黑科技”,恰恰能從你點(diǎn)擊按鍵的時(shí)間和手指面積,推測出你當時(shí)的情緒。你的漫不經(jīng)心、憤怒或者感動(dòng),都能夠成為后臺為你推送何種消息的依據。未來(lái),如下場(chǎng)景可期:

    如果你正處在被女神甩掉的悲傷中,也許客戶(hù)端會(huì )為你推送——搞基的一百種好處。如果你正處在領(lǐng)到本月工資飄飄欲仙的快樂(lè )中,也許客戶(hù)端會(huì )為你推送——在北京月兩萬(wàn)何時(shí)能買(mǎi)一個(gè)廁所?

    那么這種“恰到好處“的情緒拿捏和大數據有什么關(guān)系呢?實(shí)際上對你情緒的推測是建立在對你多次正常點(diǎn)擊的記錄之上的。這種行為數據甚至在你還未意識到的時(shí)候,就“出賣(mài)”了你的情緒。

    今日頭條技術(shù)副總裁楊震原在分析一個(gè)按鈕的平均觸摸時(shí)間

    你的“姿勢”,才是真的大數據

    銀行每天的交易賬目流水的統計數據,并不是大數據,而每個(gè)用戶(hù)在拿號之后等待了多久才排到,有多少用戶(hù)罵娘,有多少用戶(hù)過(guò)于焦急憤而離去,這些真正的行為才是大數據。

    楊震原又舉了今日頭條在應用中的另一個(gè)例子。

    實(shí)際上,你在一篇文章的什么位置停留多久,然后劃動(dòng)了多遠,在新的位置停留了多久,是否看了評論,看了幾條評論,都可以按順序被記錄下來(lái)。接下來(lái)就是通過(guò)算法評估讀者的興趣所在。

    CSDN創(chuàng )始人蔣濤也特別提到,美國電商平臺Wish正是用大數據的方法,根據每個(gè)人的數據不同,“看人下菜碟”地推薦你可能喜歡的貨品,三年時(shí)間已經(jīng)發(fā)展成北美最大的電商之一。

    所以,一個(gè)悲傷的消息是:未來(lái)如果你要隱藏自己的身份,不僅僅要變裝易容偽造指紋,甚至連點(diǎn)擊手機,查看文章的習慣都要改變了。

    大數據就是:一個(gè)都不能少

    如果要想知道有多大比例的人喜歡GV,那么只需要做好抽樣調查就可以了,沒(méi)有必要對所有人進(jìn)行調查。但是如果你想要推銷(xiāo)宅腐的周邊智能硬件產(chǎn)品,則需要逐個(gè)排查每個(gè)人“獨特”的興趣愛(ài)好。

    所有數據一個(gè)都不能少,這就是所謂的“全量加工”,這些數據的制造者正是各大廠(chǎng)商利潤的源泉。

    360商業(yè)產(chǎn)品首席架構師劉鵬是一名網(wǎng)紅,他在很多場(chǎng)合都強調:全量加工才是大數據。他說(shuō),涉及到個(gè)性化推薦、計算廣告、個(gè)人征信這些場(chǎng)景,大規模的計算就是無(wú)法避免的。

    從技術(shù)角度來(lái)說(shuō),之所以大數據可以做到這么精準,也主要得益于技術(shù)的進(jìn)步。感知設備被豐富地用在五花八門(mén)的硬件上,使得以前無(wú)法記錄的數據,現在都可以被記錄了。

    大數據不應該給人用

    大數據應該交給機器做決策,而不是交給人做決策。

    這種洋溢著(zhù)對人類(lèi)深深不信任感的論斷同樣來(lái)自于劉鵬。在他眼中,大數據是為機器提供的食糧。而能夠駕馭大數據的人類(lèi)基本只有兩種:數據科學(xué)家和統計工作者。

    IT企業(yè)中養一群科學(xué)家的可能性為零。而人類(lèi)的判斷往往基于宏觀(guān)、戰略,不可能有精力做到“因事而異”。相比之下機器的判斷比人類(lèi)更加細致。比如為每個(gè)用戶(hù)比如畫(huà)像、貼標簽。所以,要想把大數據利用透徹,愚蠢的人類(lèi)還是暫時(shí)靠邊站吧。

    “有點(diǎn)錯誤”的大數據更好用

    “數據”這兩個(gè)字,天然給人一種完美而且精準的感覺(jué)。在這方面,大數據要挑戰你的底線(xiàn)。作為數字廣告領(lǐng)域的大牛,劉鵬強調,大數據可以存在半一致性這樣模棱兩可的屬性。換句話(huà)說(shuō),允許數據錯誤和丟失。

    納尼?錯誤的數據也是好數據嗎?沒(méi)錯。由于數據量巨大,而且分析半天往往沒(méi)什么有用的收獲(價(jià)值密度低),分析者往往需要選取一些特征數據做加工,而對于這些特征數據,也許還要簡(jiǎn)化之后再加工。所以最終大數據要達到的結果是難得糊涂,卻一針見(jiàn)血。

    所以,如果有人向喜愛(ài)人民網(wǎng)的你推薦草榴的時(shí)候,先不要發(fā)火,你可能只是大數據的一個(gè)錯誤罷了。

    保險公司最喜歡和大數據在一起

    如果你是一個(gè)魯莽的人,最想知道這個(gè)情況的無(wú)疑是你的汽車(chē)保險公司,想必你的保費會(huì )居高不下;如果你是一個(gè)謹小慎微的人,最想知道的也是保險公司,因為它可以用打折的保費吸引你投保。

    在你身上,甚至存在一個(gè)精確的“岀險率”數字。這個(gè)聽(tīng)上去很驚悚的數字恰恰是保險公司利潤的來(lái)源。因為不掌握這樣大數據的個(gè)人,是無(wú)法計算自己的岀險率的。保險公司恰恰利用這種信息不對稱(chēng),給一個(gè)岀險率是萬(wàn)分之一的人開(kāi)出了千分之一的保價(jià),相當于賺了十倍的利潤。

    隱私問(wèn)題要靠技術(shù)改進(jìn)

    數據比它看上去的樣子更險惡,這是大數據業(yè)內人士的普遍共識。即使隱去了你的姓名電話(huà)等等敏感信息,只保留你和其他人聯(lián)系的記錄,熟悉你的人完全可以猜到你的身份。目前大數據的安全性,在他人的惡意之下,顯得力不從心。

    隱私問(wèn)題,制度只能解決20分,剩下的80分要靠技術(shù)進(jìn)步來(lái)解決。

    劉鵬如是說(shuō)。期待市場(chǎng)倒退到前大數據時(shí)代,似乎沒(méi)有希望了。

    如何精確統計出有多少人喜愛(ài)蒼井空,有多少人喜歡武藤蘭,但是又不泄露到底是誰(shuí)喜歡蒼老師,誰(shuí)喜歡武老師,這是目前大數據的最前沿研究。

    有關(guān)大數據的政策再?lài)栏?,沒(méi)有一套可靠的保密技術(shù),數據的安全都是無(wú)從談起的。隱私算法、數據脫敏、數據隔離。都是研究的方向。在此之前,各位的大數據還都在相對危險的狀態(tài)。這也是為什么目前法律沒(méi)有禁止數據買(mǎi)賣(mài),而各大巨頭卻不敢將數據出售的原因。當然,大數據庫市場(chǎng)價(jià)目前比較低也是一個(gè)重要的原因。

此文關(guān)鍵字:大數據,大數據,隱私問(wèn)題

推薦商品