只有這樣的描述的話,可能第一反應會是使用無監督學習方法進行聚類學習,然后再根據聚類情況中的正樣本去標記類群吧。
因為有很多樣本不具有標簽,如果使用監督學習,沒有標簽的數據會成為一個問題,但是使用無監督學習去分類的話,同一類的數據之間的距離會遠遠短于與另一個類群內數據的距離。再根據已知標簽去標記類群的話,雖然無法做到百分之百準確度,應該也會具有一定的準確性。
只有這樣的描述的話,可能第一反應會是使用無監督學習方法進行聚類學習,然后再根據聚類情況中的正樣本去標記類群吧。
因為有很多樣本不具有標簽,如果使用監督學習,沒有標簽的數據會成為一個問題,但是使用無監督學習去分類的話,同一類的數據之間的距離會遠遠短于與另一個類群內數據的距離。再根據已知標簽去標記類群的話,雖然無法做到百分之百準確度,應該也會具有一定的準確性。