如何獲得使用BeautifulSoup只是兩個指定標(biāo)簽之間的所有文本

如何獲得使用BeautifulSoup只是兩個指定標(biāo)簽之間的所有文本？

因為你的html不是合法的xml格式，標(biāo)簽沒有成對出現(xiàn)，只能用html解析器

from bs4 import BeautifulSoup

s = """

714659079qqcom 2014/09/10 10:14

"""

soup = BeautifulSoup(s, "html.parser")

print soup

print soup.get_text()

如果你想用正則的話，只要把標(biāo)簽匹配掉就可以了

import re

s = """

714659079qqcom 2014/09/10 10:14

"""

dr = re.compile(r']+>', re.S)

dd = dr.sub('', s)

print dd

色婷婷狠狠18禁久久YY,CHINESE性内射高清国产,国产女人18毛片水真多1,国产AV在线观看