Python的OCR模塊可以幫助程序員在Python程序中實現圖像文字的識別和提取。在OCR模塊中,最為流行的是使用開源庫Tesseract來實現OCR功能。
import pytesseract from PIL import Image pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' # 設置tesseract的路徑 def ocr(image_path): image = Image.open(image_path) # 打開圖片 text = pytesseract.image_to_string(image, lang='chi_sim') #提取圖像中的文字 return text if __name__ == '__main__': text = ocr('example.png') print(text)
在該樣例中,程序首先需要導入pytesseract和Pillow庫。接下來設置tesseract的路徑,將要讀取圖片傳入函數中實現OCR功能,在OCR函數中,使用pytesseract.image_to_string函數來識別圖像中的文字,設置lang參數表示識別語言為中文,然后返回提取的文字。最后,在main函數中,讀取示例圖片example.png,調用OCR函數進行文字識別,并打印提取的文字。