使用spark運(yùn)行協(xié)同過濾算法?
對于隱式反饋而言,用戶對于item沒有顯式的評分?jǐn)?shù)據(jù),這種情況下對考慮rating值得時候應(yīng)該需要結(jié)合具體的業(yè)務(wù)場景對應(yīng)的數(shù)據(jù)去設(shè)計。
例如:
短視頻推薦
(1) 根據(jù)不同用戶行為設(shè)置rating值
對于短視頻推薦中,可以根據(jù)用戶的觀看、點贊、分享等不同行為設(shè)置不同的rating值。這樣設(shè)置rating值得缺陷在于,用戶點贊和分享的行為數(shù)據(jù)非常稀疏,無法單一使用,結(jié)合觀看、點贊、分享行為數(shù)據(jù)綜合考慮用戶對item的rating值需要考慮不同行為對rating值得權(quán)重影響。
(2) 根據(jù)同一行為的不同特征設(shè)置rating值。
同一行為可以考慮用戶行為具有的不同特征值來設(shè)置用戶對物品的rating值,例如視頻的觀看時長、觀看完成度、如果考慮時間衰減因素的話可以結(jié)合觀看時間距離當(dāng)前的時間差等因素綜合考慮設(shè)置item的rating值。
當(dāng)然,不同的推薦系統(tǒng)中根據(jù)具體業(yè)務(wù)有不同的設(shè)置方式,例如電商推薦的可能考慮物品的價格,新聞資訊的推薦可以能考慮篇幅長度等等上面所說的只是一個參考。