統(tǒng)計(jì)數(shù)據(jù)的類型
數(shù)據(jù)的計(jì)量尺度被分為3類:
名義(Nominal)變量:又叫無序列別變量,比如性別:男/女
有序(Ordinal):又叫有序類別變量,比如收入劃分為:低/中/高
度量(Scale):又叫連續(xù)性變量,比如具體工資收入金額
特征分析和處理
- 名義變量:One-Hot編碼。比如,兩個(gè)變量采用10和01的形式來編碼,三個(gè)變量采用100、010和001的形式,以此類推
- 有序變量:按照因變量影響由小到大的順序編碼為1、2、3,…。比如,收入低中高編碼為1、2、3,以此類推
- 度量變量:為了防止結(jié)果受某些值較大的屬性的影響一般需要進(jìn)行標(biāo)準(zhǔn)化處理。比如,Z-Score標(biāo)準(zhǔn)化,Max-Min標(biāo)準(zhǔn)化等
關(guān)于數(shù)據(jù)分析與人工智能的更多內(nèi)容,歡迎到作者主頁(yè)查看~