大數據風控公司短時間內遭到集中“定點爆破”,濫用爬蟲技術恐成主要原因:
1、嚴格禁止通過技術手段繞過服務器的訪問限制,或破解被爬網站為保護數據而采取的加密算法及技術保護措施,從而對被爬網站受保護的計算機信息系統中的數據進行爬取。
2、若被爬網站設定了獲取數據信息的措施(包括實名認證、賬號密碼、內部權限等),爬蟲企業應避免通過偽造實名認證或竊取賬號密碼、內部權限的形式獲取數據。
3、避免或謹慎抓取身份認證信息。
4、對大數據公司,特別是大數據風控企業來說,獲取“裁判文書網”“執行信息公開網”等網站的數據非常普遍且重要,但爬取這類國家事務網站的信息時應當尤為審慎,特別是在網站已采取相關“反爬措施”的情況下,仍強行惡意突破防護措施爬取數據,對網站運行造成影響的,均可能構成犯罪。