Python 是一種強大的編程語言,可以用來編寫各種不同的應用程序。其中,批量轉編碼是 Python 中的一個相對常見的操作,它可以將多個文件同時轉換為指定的編碼格式。下面將介紹如何使用 Python 來進行批量轉編碼。
# 導入所需的庫 import chardet import os # 指定待轉碼的文件夾路徑 folder_path = "/path/to/folder" # 指定目標編碼格式 target_encode = "utf-8" # 遍歷文件夾中的所有文件 for filename in os.listdir(folder_path): # 拼接文件的絕對路徑 file_path = os.path.join(folder_path, filename) # 判斷該文件是否是文件夾 if not os.path.isdir(file_path): # 讀取該文件的原始編碼格式 with open(file_path, 'rb') as f: content = f.read() source_encode = chardet.detect(content)['encoding'] # 如果原始編碼格式和目標編碼格式不一致,進行編碼轉換 if source_encode != target_encode and source_encode is not None: with open(file_path, 'r', encoding=source_encode) as f: content = f.read() with open(file_path, 'w', encoding=target_encode) as f: f.write(content) print("文件 {} 編碼轉換完成".format(filename)) else: print("文件 {} 已經是目標編碼格式".format(filename))
上述代碼使用了 chardet 庫來自動檢測文件的原始編碼格式,通過遍歷文件夾中的所有文件,并逐一進行編碼轉換,最終輸出轉換結果。
需要注意的是,編碼轉換可能會導致一些字符無法正確顯示,因此建議在轉換前備份原始文件,以便需要時進行恢復。