在現(xiàn)代的互聯(lián)網(wǎng)時(shí)代,搜索引擎扮演著不可替代的作用。作為全球最熱門的搜索引擎之一,百度憑借其簡(jiǎn)單易用、功能強(qiáng)大等優(yōu)點(diǎn),成為了大多數(shù)網(wǎng)民不可或缺的工具之一。那么,如何使用Python編寫一個(gè)簡(jiǎn)單的百度搜索引擎呢?下面我們一起來探討一下。
# 導(dǎo)入requests庫(kù)和pyquery庫(kù) import requests from pyquery import PyQuery as pq # 設(shè)置請(qǐng)求頭 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} # 定義搜索函數(shù) def search(keyword): # 設(shè)置搜索鏈接 url = 'https://www.baidu.com/s?wd=' + keyword # 發(fā)起請(qǐng)求 response = requests.get(url, headers=headers) # 解析結(jié)果 doc = pq(response.text) # 獲取搜索結(jié)果的標(biāo)題、鏈接、描述信息 results = [] for item in doc('.t').items(): result = {} result['title'] = item.text() result['link'] = item.attr('href') result['desc'] = item.parents('.c-container').find('.c-abstract').text() results.append(result) return results # 測(cè)試函數(shù) if __name__ == '__main__': keyword = input('請(qǐng)輸入關(guān)鍵詞:') results = search(keyword) for item in results: print('標(biāo)題:', item['title']) print('鏈接:', item['link']) print('描述:', item['desc']) print('---------------------')
通過以上代碼,我們可以成功使用Python模擬百度搜索,實(shí)現(xiàn)了搜索結(jié)果的標(biāo)題、鏈接、描述信息的獲取。這不僅可以方便爬蟲程序的編寫,還可以為搜索引擎優(yōu)化提供一定參考。