這是一個(gè)非常好的問題,作為一名大數(shù)據(jù)從業(yè)者,我來回答一下。
首先,要想簡單明了地表述出大數(shù)據(jù)的概念和操作,應(yīng)該站在一個(gè)更高的視野來看待大數(shù)據(jù),通常來說,站在行業(yè)的高度來看待大數(shù)據(jù),大數(shù)據(jù)的核心在于為行業(yè)領(lǐng)域帶來新的價(jià)值空間,通過大數(shù)據(jù)來全面重塑企業(yè)各種模式,而如果單純地站在數(shù)據(jù)的角度來看待大數(shù)據(jù),大數(shù)據(jù)的核心在于數(shù)據(jù)的價(jià)值化,數(shù)據(jù)價(jià)值化的過程本身就能夠開辟出一個(gè)巨大的價(jià)值空間。
大數(shù)據(jù)的操作要緊緊圍繞大數(shù)據(jù)的價(jià)值空間來展開,目前主要的操作可以分為三大塊,分別是數(shù)據(jù)采集操作、數(shù)據(jù)分析操作和數(shù)據(jù)應(yīng)用操作,這些操作的背后幾乎涵蓋了當(dāng)前大數(shù)據(jù)行業(yè)的所有產(chǎn)業(yè)鏈。
數(shù)據(jù)采集操作是大數(shù)據(jù)產(chǎn)業(yè)鏈的起始端,所以要想了解大數(shù)據(jù)操作,首先就應(yīng)該從數(shù)據(jù)采集開始。當(dāng)前數(shù)據(jù)采集渠道通常有三個(gè),一個(gè)是傳統(tǒng)信息系統(tǒng),比如各種ERP系統(tǒng)就是典型的代表,這些ERP系統(tǒng)當(dāng)中的數(shù)據(jù)往往具有較高的價(jià)值密度,通常對于安全性也有非常高的要求。從數(shù)據(jù)結(jié)構(gòu)上來看,傳統(tǒng)信息系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)是相對比較單一的,處理起來也比較容易。
其二是互聯(lián)網(wǎng)(Web)系統(tǒng),相對于ERP系統(tǒng)來說,互聯(lián)網(wǎng)本身就是一個(gè)巨大的數(shù)據(jù)池,這個(gè)數(shù)據(jù)池不僅承載了大量的數(shù)據(jù),同時(shí)還在不斷更新,這也為數(shù)據(jù)采集提供了天然的渠道。相對于傳統(tǒng)信息系統(tǒng)來說,互聯(lián)網(wǎng)系統(tǒng)本身的數(shù)據(jù)類型是比較復(fù)雜的,結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)混雜,這對于數(shù)據(jù)分析操作也提出了較高的要求。
其三是物聯(lián)網(wǎng)系統(tǒng),當(dāng)前物聯(lián)網(wǎng)系統(tǒng)所產(chǎn)生的數(shù)據(jù)是大數(shù)據(jù)的主要數(shù)據(jù)來源,也可以說物聯(lián)網(wǎng)是促進(jìn)大數(shù)據(jù)概念產(chǎn)生的重要原因之一。物聯(lián)網(wǎng)所產(chǎn)生的數(shù)據(jù)不僅數(shù)據(jù)量大,數(shù)據(jù)類型多樣化,同時(shí)物聯(lián)網(wǎng)所產(chǎn)生的數(shù)據(jù)還有比較低的價(jià)值密度,這對于數(shù)據(jù)分析技術(shù)提出了更高的要求。隨著5G通信的落地應(yīng)用,物聯(lián)網(wǎng)本身產(chǎn)生的數(shù)據(jù)量會越來越大,自身的價(jià)值空間也會越來越大。
數(shù)據(jù)分析操作是當(dāng)前大數(shù)據(jù)操作的重要環(huán)節(jié),實(shí)際上對于大量傳統(tǒng)行業(yè)來說,數(shù)據(jù)分析將是很多職場人需要重點(diǎn)掌握的技能之一。當(dāng)前數(shù)據(jù)分析操作有兩種主要方式,一種是統(tǒng)計(jì)學(xué)方式,另一種是機(jī)器學(xué)習(xí)方式。統(tǒng)計(jì)學(xué)的數(shù)據(jù)分析方式是比較傳統(tǒng)的數(shù)據(jù)分析方式,有大量的工具可以使用,針對于結(jié)構(gòu)化數(shù)據(jù)來說,統(tǒng)計(jì)學(xué)的數(shù)據(jù)分析方式往往更適合一些。機(jī)器學(xué)習(xí)的數(shù)據(jù)分析方式針對于復(fù)雜的數(shù)據(jù)環(huán)境往往有更好的分析效果,但是對于數(shù)據(jù)分析人員也提出了更高的要求。
數(shù)據(jù)應(yīng)用操作是體現(xiàn)大數(shù)據(jù)價(jià)值的重要渠道,所以數(shù)據(jù)應(yīng)用操作也非常重要。從最終的應(yīng)用目標(biāo)來看,數(shù)據(jù)應(yīng)用操作的目標(biāo)無外乎兩大類,一類是人類用戶,另一類是智能體(人工智能產(chǎn)品)。從大的發(fā)展趨勢來看,在大數(shù)據(jù)時(shí)代,要想充分發(fā)揮出大數(shù)據(jù)的價(jià)值,應(yīng)該重視智能體的應(yīng)用渠道。
我從事互聯(lián)網(wǎng)行業(yè)多年,目前也在帶計(jì)算機(jī)專業(yè)的研究生,主要的研究方向集中在大數(shù)據(jù)和人工智能領(lǐng)域,我會陸續(xù)寫一些關(guān)于互聯(lián)網(wǎng)技術(shù)方面的文章,感興趣的朋友可以關(guān)注我,相信一定會有所收獲。
如果有互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等方面的問題,或者是考研方面的問題,都可以在評論區(qū)留言,或者私信我!