色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看

大數據的推薦算法真的很厲害嗎?

錢良釵2年前16瀏覽0評論

應該說還是比較準確的。手機用戶一般以IMEI來作為用戶身份標識,電腦端的話一般采集cookies信息。比如針對用戶性別的分析,有數據表明,90%的準確度是可以達到的。

大數據主要來生成用戶畫像,刻畫出用戶畫像,便可針對性的推薦,實現精準營銷。以下是用戶畫像的生成過程:

1數據采集

采集數據時,一般來說將用戶畫像的目標進行分解,進行多元素,多維度的數據采集,像用戶的基本信息數據、社會屬性數據可通過用戶信息填寫、調查問卷等方式獲取,而用戶的行為數據需要通過用戶行為的采集,這里就涉及到手機、PC端的數據獲取。

2數據預處理

數據采集到的一般為結構化,非結構化的數據,需要將數據清洗、數據結構化處理、數據合并等操作,數據篩選清理針對無效或者虛假數據進行處理剔除,甄別出有效的用戶數據;數據結構化處理以及數據整合等需結合分析目標進行特點行為數據的采集,刻畫出用戶信息的基本結構。

3數據標簽化,并賦予權重

打標簽是將得到的各項用戶信息映射到標簽,并且賦予各個標簽賦相應的權重。在這里權重值計算是至關重要的一步,它決定了構建用戶畫像的架構,以視頻類APP為例,用戶的喜好等都會通過播放視頻來體現,那么其中某項標簽的行為用戶越多,那么該標簽對應的權重越大,但是,權重一旦賦予并不是一成不變,隨著時間的推移,是需要實施調整的。用戶喜歡觀看的各視頻類型的標簽數據如下:

4生成畫像

當所有的用戶的信息都生成標簽且得賦予了權重以后,每個用戶自己的標簽體系也具備,則可以根據各業務應用場景的不同需求進行匹配篩選,進行個體與總體的對比,進行精準推送廣告營銷等。