python怎么自動批量讀取文件夾下的excel?
Python批量讀取特定文件夾下Excel的話,主要分為2步,首先根據(jù)后綴名(xls或xlsx)匹配出所有Excel文件,然后直接利用相關模塊(pandas,openpyxl等)讀取即可,下面我簡單介紹一下實現(xiàn)過程,感興趣的朋友可以嘗試一下:
01查找所有Excel文件這一步非常簡單,主要是根據(jù)后綴名匹配所有Excel文件,基本思路先使用os.walk函數(shù)遍歷指定的文件夾,找到所有文件,然后一一匹配文件后綴名,如果是xls或xlsx,則為Excel文件,添加到list列表,之后返回,后面讀取函數(shù)就是根據(jù)這個列表(存儲所有搜索到的Excel文件路徑)讀取Excel文件:
02讀取Excel文件內容這一步主要你是根據(jù)上一步找到的Excel文件路徑直接讀取Excel文件,至于讀取模塊或庫的話,那就非常多啦,基本的xlrd,xlutils,openpyxl都行,最簡單的方式就是使用pandas,一個著名的數(shù)據(jù)處理庫,內置了大量函數(shù)和類型,可以輕松處理Excel等日常各種文件,安裝的話,直接在cmd窗口輸入命令“pip install pandas”即可:
安裝完成后,我們就可以直接使用pandas庫讀取Excel文件了,非常簡單,只需要一行代碼即可搞定,也就是read_excel函數(shù),傳入Excel文件路徑就行,默認情況下會讀取列標題,如果你不需要列標題的話,設置header=None即可,讀取的數(shù)據(jù)類型為DataFrame,后續(xù)處理的話,也非常方便:
至此,我們就完成了利用Python批量讀取特定文件夾下Excel。總的來說,整個過程非常簡單,就是根據(jù)后綴名匹配查找,然后直接讀取即可,只要你有一定Python基礎,熟悉一下上面的代碼和示例,很快就能掌握的,網(wǎng)上也有相關教程和資料,介紹的非常詳細,感興趣的話,可以搜一下,希望以上分享的內容能對你有所幫助吧,也歡迎大家評論、留言進行補充。