Python 可以通過一些第三方庫來爬取聊天記錄,例如使用 seleniuim 實現自動化控制瀏覽器操作,在瀏覽器中登錄并獲取聊天記錄,或者使用直接請求 API 的方式獲取聊天記錄。
from selenium import webdriver driver = webdriver.Chrome() driver.get('https://www.xxx.com') # 填寫賬號密碼并登錄 driver.find_element_by_id('username').send_keys('xxxx') driver.find_element_by_id('password').send_keys('xxxx') driver.find_element_by_id('login-btn').click() # 爬取聊天記錄 records = driver.find_elements_by_xpath('//div[@class="msg-content"]') for record in records: print(record.text) driver.quit()
另一種方式是直接請求 API,例如針對微信聊天記錄的接口為:
import requests response = requests.get('https://wx.qq.com/cgi-bin/mmwebwx-bin/webwxgetmsgimg', params={'access_token': 'xxxx', 'type': 'TYPE_READER_MESSAGE', 'frommsgid': 100, 'todmsgid': 200}) data = response.json() for message in data['messageList']: print(message['content'])
需要注意的是,聊天記錄可能包含敏感信息,需要經過合法授權和保護隱私的考慮。
上一篇vue中管道符
下一篇python 爬蟲 魚c