從數據本身而言,大數據是人工智能的核心競爭資源
有人說:數據、算法、算力是人工智能的核心三大模塊。說是數據驅動的人工智能,不為過。沒有數據,
互聯網時代,每個公司積累的大數據,是每個公司的戰略物資。比如電商的用戶行為數據,比如社交領域的用戶通信數據。
后續的機器學習、深度學習,從預測算法到客服機器人、人臉識別等等,背后模型都是以大量的數據為基礎的。比如NLP領域:從GPT,BERT,GPT2,Transormer-XL,XLNET,RoBERTa,模型背后的數據越來越多,模型越來越重,精度越來越高。
未來人工智能的落地,依賴于大數據。比如金融、醫療行業,
從技術角度來講,大數據日趨成熟,成為應用的底層基礎技術
大數據技術越來越成熟,從離線數據到實時數據,從結構化數據到非結構化數據,從hadoop到spark,storm。
很多公司都有自己的大數據團隊構建的大數據平臺,有點類似運維工作的味道。前幾年,你說你會hadoop;
大數據與隱私
很多人意識到了數據的重要性,并想方設法從中盈利。如果你買過房子,不久后你可能會收到中介的電話,問你的房子要不要出租;或者問你的房子,要不要裝修。等你小孩上學,會收到電話,問你小孩要不要舞蹈、鋼琴、英語培訓。
大數據帶動了數據采集的需求。從人工收集到APP等索要各種權限,大數據采集的成本越來越低。最近因為爬蟲,很多人甚至公司整個團隊被抓,將來預計對這方面的立法會越來越關注。
很多大公司的app,都會要求你同意一個協議,里面說白了要用你的數據,需要你同意。對于這些app,鑒于市場環境,沒法拒絕,除非你拒絕用它。從用戶角度而言,想拒絕,很難。