色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

互聯網時代,大數據充當怎樣的角色?

呂致盈2年前11瀏覽0評論

人工智能是巧婦,大數據是米;大數據工程人員越來越有運維的味道,成為底層基礎的技術;大數據與隱私的權衡,需要關注。

從數據本身而言,大數據是人工智能的核心競爭資源

有人說:數據、算法、算力是人工智能的核心三大模塊。說是數據驅動的人工智能,不為過。沒有數據,算法就是巧婦難為無米之炊,數據是知識的外在表現形式。

互聯網時代,每個公司積累的大數據,是每個公司的戰略物資。比如電商的用戶行為數據,比如社交領域的用戶通信數據。

后續的機器學習、深度學習,從預測算法到客服機器人、人臉識別等等,背后模型都是以大量的數據為基礎的。比如NLP領域:從GPT,BERT,GPT2,Transormer-XL,XLNET,RoBERTa,模型背后的數據越來越多,模型越來越重,精度越來越高。

未來人工智能的落地,依賴于大數據。比如金融、醫療行業,誰有真正的大數據,誰才有可能脫穎而出。

從技術角度來講,大數據日趨成熟,成為應用的底層基礎技術

大數據技術越來越成熟,從離線數據到實時數據,從結構化數據到非結構化數據,從hadoop到spark,storm。

很多公司都有自己的大數據團隊構建的大數據平臺,有點類似運維工作的味道。前幾年,你說你會hadoop;今年你肯定不好意思再這樣說,因為大家都會hadoop的皮毛。

大數據與隱私

很多人意識到了數據的重要性,并想方設法從中盈利。如果你買過房子,不久后你可能會收到中介的電話,問你的房子要不要出租;或者問你的房子,要不要裝修。等你小孩上學,會收到電話,問你小孩要不要舞蹈、鋼琴、英語培訓。

大數據帶動了數據采集的需求。從人工收集到APP等索要各種權限,大數據采集的成本越來越低。最近因為爬蟲,很多人甚至公司整個團隊被抓,將來預計對這方面的立法會越來越關注。

很多大公司的app,都會要求你同意一個協議,里面說白了要用你的數據,需要你同意。對于這些app,鑒于市場環境,沒法拒絕,除非你拒絕用它。從用戶角度而言,想拒絕,很難。

怎么用好大數據,并保護好隱私,是未來需要權衡的一點。