短網址是現代社會中越來越常用的功能,Python具有強大的網絡爬蟲和正則表達式的處理能力,可以極大簡化短網址還原的過程。
import requests
import re
def get_real_url(short_url):
try:
response = requests.get(short_url, allow_redirects=False, timeout=3)
if response.status_code == 301 | response.status_code == 302:
real_url = response.headers['Location']
return real_url
except:
pass
reg_url = r''
reg_res = re.findall(reg_url, response.text)
if reg_res:
real_url = reg_res[0]
return real_url
return short_url
以上代碼實現了短網址還原的功能,首先根據短網址請求網站,如果返回301或302狀態碼,則獲取Location信息,即真實網址;如果不返回重定向狀態碼,則使用正則表達式尋找真實網址。
使用該函數進行短網址還原只需要調用get_real_url函數,即可獲取真正的網址。在大規模短網址還原的情況下,可以使用多線程或多進程的方式提高效率。
上一篇vue偽微信
下一篇e4a json教程