Python 是一種高級編程語言,深受數據科學和機器學習愛好者的喜愛。而在數據挖掘領域,關聯分析是一種非常實用的技術。Python 中的關聯分析庫,可以幫助我們更快速地進行關聯分析。
import pandas
import numpy
from mlxtend.frequent_patterns import apriori
from mlxtend.frequent_patterns import association_rules
#導入數據集
data = pandas.read_csv('GroceryStore.csv', header=None, delim_whitespace=True)
print(data.head())
#使用Apriori算法
frequentItemsets = apriori(data, min_support=0.1, use_colnames=True)
#關聯規則挖掘
rules = association_rules(frequentItemsets, metric="lift", min_threshold=1)
print(rules.head())
在上述代碼中,我們先導入了 pandas 和 numpy 模塊,然后使用 mlxtend 庫中的 apriori 函數來實現 Apriori 算法,得到頻繁項集。接著,使用 association_rules 函數來挖掘關聯規則。在關聯規則挖掘中,指定了 metric 為 lift,表示使用 lift 值來評估每條規則。規則集的最小閾值設置為 1。
Python 中的關聯分析庫可以用于市場籃子分析、用戶購物行為分析等領域。通過關聯分析,我們可以發現產品之間的關聯、用戶的購買習慣等有用信息,為數據驅動的營銷提供幫助。
上一篇python+寫入cvs
下一篇mysql語句連接兩個表