大數(shù)據(jù)是什么意思?
當(dāng)然可以泄露隱私,前提是你的個(gè)人信息已經(jīng)泄露。當(dāng)然每個(gè)人的隱私不可能絕對(duì)不泄露,自己再小心也沒(méi)用。比如你的真實(shí)信息在支付寶中有登記,在公安局有登記,在銀行有登記,在房產(chǎn)局有登記,在車管所有登記,在保險(xiǎn)公司有登記,在工作單位有登記,在畢業(yè)學(xué)校有登記... 這些機(jī)構(gòu)一般不會(huì)輕易泄露你的信息,但也不是100%安全的。遇到黑客盜取怎么辦??jī)?nèi)部人員私下跟外面交易數(shù)據(jù)怎么辦?這些單位會(huì)把數(shù)據(jù)轉(zhuǎn)發(fā)給相關(guān)大數(shù)據(jù)軟件開(kāi)發(fā)公司,雖然簽定了保密協(xié)議,但畢竟數(shù)據(jù)可以被更多人看到了,增加了泄露的風(fēng)險(xiǎn)。這種數(shù)據(jù)泄露確實(shí)發(fā)生過(guò),只不過(guò)很少見(jiàn)。我們常見(jiàn)的數(shù)據(jù)泄露機(jī)構(gòu)有:房地產(chǎn)開(kāi)發(fā)商,物業(yè)公司,賓館酒店,一般網(wǎng)站,國(guó)產(chǎn)瀏覽器... 基本上你才登記,一會(huì)兒就有人打你電話裝修嗎?賣房嗎?瀏覽器給你推送廣告。所以對(duì)于這些不靠譜的機(jī)構(gòu),我們能不提供真實(shí)信息就不要提供真實(shí)信息,能不留下電話號(hào)碼就不要留。一般買房賣房都會(huì)專門辦個(gè)臨時(shí)號(hào)碼。但是住賓館要身份證,這個(gè)不好辦。這些數(shù)據(jù)如果分散開(kāi)來(lái),每個(gè)單位掌握一點(diǎn)點(diǎn),那就不叫大數(shù)據(jù),如果全部匯集起來(lái),被大數(shù)據(jù)軟件開(kāi)發(fā)公司掌握,那就相當(dāng)危險(xiǎn)。舉個(gè)例子: 你昨天晚上開(kāi)著你的寶馬車載著你的小三去吃了飯,然后開(kāi)了房。騙你老婆說(shuō)加班。你開(kāi)房還用的別人身份證(賓館常客,服務(wù)員視而不見(jiàn)),付錢也都是用的小三的卡。你很小心,你以為查不到小三是誰(shuí)。假設(shè)這些數(shù)據(jù)某大數(shù)據(jù)公司全掌握,并且為你老婆提供查案服務(wù)。那么先查詢你的寶馬車的行車軌跡數(shù)據(jù)(在城市里到處都是交警的卡口和電警攝像頭)得知你的大概落腳點(diǎn)范圍和時(shí)間點(diǎn)。看時(shí)間點(diǎn)是晚飯時(shí)間,你應(yīng)該會(huì)去吃飯。分析你平時(shí)喜歡去的飯店都比較高檔。那么一過(guò)濾,你落腳點(diǎn)附近適合的飯店就那么幾家。你還喜歡消費(fèi)某款白酒,再確定是兩人桌。那么那天晚上消費(fèi)了那款白酒的二人桌 可能就只有幾桌啊。于是定位到那家飯店,再根據(jù)那幾桌的刷卡記錄關(guān)聯(lián)到付款人的身份信息。接下來(lái)就是分析這些付款人跟你有沒(méi)有過(guò)交集?排除掉男性和年老女性,最后還剩下兩位年輕女性,其中一位在一年前曾就職的一家公司 正是你的生意伙伴。你和那家公司之間的許多合同能夠查的到。那么確定她是你的小三,再查她的開(kāi)房記錄,發(fā)現(xiàn)每次跟她一起的 都是一個(gè)農(nóng)村老頭,和她不同姓,不合常理。所以你的一切基本確定了,事后只要去調(diào)取相關(guān)地方的監(jiān)控視頻,那就是鐵證。例子可能不太準(zhǔn)確。但是大數(shù)據(jù)主要是匯集了多種數(shù)據(jù),然后分析習(xí)慣行為,再互相串并,得出不可思議的結(jié)果。以前為什么沒(méi)有大數(shù)據(jù)?因?yàn)榧夹g(shù)不成熟。以前沒(méi)有能力將這么多巨大的數(shù)據(jù)存儲(chǔ)在一起,而且還要快速讀取和運(yùn)算。傳統(tǒng)的oracle數(shù)據(jù)庫(kù),當(dāng)數(shù)據(jù)量超過(guò)幾億時(shí),就查詢統(tǒng)計(jì)崩潰,無(wú)法運(yùn)行。而現(xiàn)在是分布式架構(gòu),像國(guó)阿里,百度,華為等大公司,它們的大數(shù)據(jù)集群服務(wù)器數(shù)量達(dá)到上萬(wàn)臺(tái)。數(shù)據(jù)再多,分散到上萬(wàn)臺(tái)上之后,每臺(tái)上也沒(méi)多少了。每臺(tái)讀取10M,一萬(wàn)臺(tái)一起讀,那么讀取 100000M數(shù)據(jù)還需要等一個(gè)小時(shí)嗎?計(jì)算再慢,一萬(wàn)臺(tái)一起算還會(huì)慢嗎?這種分布式存儲(chǔ)和分布式運(yùn)算技術(shù)也就是最近10年才發(fā)展起來(lái)的。所以最近才常聽(tīng)到大數(shù)據(jù)。