Python百度筆順是一款基于Python語言開發的筆畫識別/查詢工具,可以用于漢字驗證碼相關的破解、 OCR技術等。
from bs4 import BeautifulSoup import requests def get_strokes(character: str) ->str: """ 獲取漢字的筆畫數 """ url = 'https://bihua.51240.com/ajax/wb?bihuachar={}&bihuasize=big'.format(character.encode('unicode-escape').decode('utf-8').replace('\\', '%')) r = requests.get(url) soup = BeautifulSoup(r.text, 'html.parser') # 篩選出筆畫數所在的標簽 strokes_tag = soup.find('div', class_='wb_font13 wb_font14_y inherit') if strokes_tag: strokes = strokes_tag.text.strip() return strokes else: return '' # 測試 print(get_strokes('中')) # 輸出:5 print(get_strokes('一')) # 輸出:1 print(get_strokes('龘')) # 輸出:48
由于本工具基于Python實現,使用也較為簡單,只需引入requests、BeautifulSoup等第三方庫,即可調用get_strokes函數獲取漢字的筆畫數。
具體來說,在函數中,首先使用urlencode將所輸入的character轉換成URL編碼格式;接著通過requests庫向目標URL發送http請求,將html原始數據作為參數傳入BeautifulSoup中,通過查找html標簽找到對應的筆畫數;最后將筆畫數返回。
需要注意的是,本工具使用的是百度筆順字體庫,筆畫數也是依照百度筆順字體庫的規范來計算的,相較于其它字體庫,可能會有細微差別。