我這兩天剛發了Python爬蟲的小程序,網上抓取《老友記》的劇情。
這個例子從安裝python開始一直到爬出數據存到文件中。
我覺得python爬蟲入門先從簡單入手,一堆學習資料拿到手也不一定會看,最最簡單的:
知道python基本語法
學過編程的人很快就能掌握,即使沒學過的看例子,再加上一句一句的解釋也能明白。
然后搭建環境
這是必備步驟,比如安裝python,JupyterNotebook和網頁爬蟲相關的包
找例子直接上手
看資料不動手會看的沒興趣,自己動手爬出東西才有成就感。
我覺得這就入門了,至于網頁開發語言,它不是爬蟲的障礙,遇到不同格式的網頁,自己查一下用法就好了。學編程最重要的是學解決問題的能力,而不是一堆類型和語法……你說對么?