Python 詞界錨定是指確定代碼中某個單詞或短語在文檔中的位置。這在處理文本和自然語言處理時是非常有用的。在 Python 中,可以使用 re 模塊的 search() 和 findall() 方法來實現詞界錨定。
import re text = "Hello World! Python is a great language." pattern = r"\bPython\b" result = re.search(pattern, text) if result: print("Python is found in the text.") else: print("Python is not found.") result = re.findall(pattern, text) if result: print("Python is found ", len(result), " times in the text.") else: print("Python is not found.")
在上面的代碼中,定義了一個文本字符串和要查找的單詞“Python”的正則表達式模式。使用 search() 方法搜索文本,如果找到了,則輸出“Python is found in the text.” 如果沒有找到,則輸出“Python is not found.” 如果要找到文本中所有的“Python”,可以使用 findall() 方法。如果找到了,輸出“Python is found x times in the text.”。
需要注意的是,為確保匹配的準確性和可靠性,可以使用 \b 元字符來指定單詞的邊界。也就是說,查找的單詞必須是獨立的,而不是包含在其他單詞中。比如,“Python”不應匹配“Pythonic”或“Pythonista”等詞匯。