如何獲得使用BeautifulSoup只是兩個指定標(biāo)簽之間的所有文本?
因為你的html不是合法的xml格式,標(biāo)簽沒有成對出現(xiàn),只能用html解析器
from bs4 import BeautifulSoup
s = """
714659079qqcom 2014/09/10 10:14
"""
soup = BeautifulSoup(s, "html.parser")
print soup
print soup.get_text()
如果你想用正則的話,只要把標(biāo)簽匹配掉就可以了
import re
s = """
714659079qqcom 2014/09/10 10:14
"""
dr = re.compile(r']+>', re.S)
dd = dr.sub('', s)
print dd