在Python的正則表達(dá)式中,空白符是一個(gè)非常有用的工具。所謂空白符,指的是空格(' ')、制表符('\t')和換行符('\n')。在正則表達(dá)式中,我們可以使用空白符來(lái)匹配任意數(shù)量的這些字符。這個(gè)功能尤其在處理文本文件時(shí),可以大大簡(jiǎn)化我們的代碼。
import re text = "這是一段文本,其中有 4 個(gè)單詞。" # 使用空白符匹配所有空格、制表符和換行符 pattern = r'\s' result = re.findall(pattern, text) print(result)
上面的代碼使用Python的正則表達(dá)式庫(kù)re,定義了一個(gè)文本字符串text和一個(gè)正則表達(dá)式pattern。這個(gè)正則表達(dá)式中的\s表示匹配空白符。接下來(lái),我們使用re.findall()方法找出text中所有匹配正則表達(dá)式的部分,并將結(jié)果存儲(chǔ)在變量result中。
運(yùn)行這段代碼,會(huì)得到一個(gè)包含所有空白符的列表。在這個(gè)例子中,結(jié)果是[' ', ' ', ' ', ' ', ' ']。由于text中有5個(gè)空格符,所以結(jié)果中有5個(gè)元素。
除了\s外,Python中還提供了其他幾個(gè)用于匹配空白符的正則表達(dá)式:
# 匹配空格字符 pattern = r'\ ' # 匹配制表符 pattern = r'\t' # 匹配換行符 pattern = r'\n'
這些正則表達(dá)式可以幫助我們快速匹配和處理文本文件中的空白符。同時(shí),我們也可以使用這些正則表達(dá)式來(lái)去除文本中的空白符,使其更容易處理。
上一篇vue fileter
下一篇python 突破反爬取