论Python爬虫是否合法(一定要看看)
網(wǎng)絡(luò)爬蟲(chóng)作為一種計(jì)算機(jī)技術(shù)就決定了它的中立性,爬蟲(chóng)本身在法律上并不被禁止,但是如果有一些別有用心的人,去使用爬蟲(chóng)做一些違法的事情,那就違法了。爬蟲(chóng)本無(wú)罪,有罪的是貪得無(wú)厭、險(xiǎn)惡的人心。正如水果刀本身在法律生并不被禁止,但你用來(lái)殺人,就等著坐牢吧!
盡管在過(guò)去 20 年間已經(jīng)做出了諸多相關(guān)裁決,不過(guò)網(wǎng)絡(luò)爬蟲(chóng)及其使用時(shí)法律所允許的內(nèi)容仍然處于建設(shè)當(dāng)中。如果被抓取的數(shù)據(jù)用于個(gè)人用途,且在合理使用版權(quán)法的情況下,通常沒(méi)有問(wèn)題。
但是,如果這些數(shù)據(jù)會(huì)被重新發(fā)布,并且抓取行為的攻擊性過(guò)強(qiáng)導(dǎo)致網(wǎng)站宕機(jī),或者其內(nèi)容受版權(quán)保護(hù),抓取行為違反了其服務(wù)條款的話(huà),那么則有一些法律判例可以提及。
網(wǎng)絡(luò)爬蟲(chóng)界有一句流行的話(huà)“爬蟲(chóng)玩的好,監(jiān)獄進(jìn)的早;爬蟲(chóng)爬得歡,監(jiān)獄要坐穿;數(shù)據(jù)玩的溜,牢飯吃個(gè)夠”,縱觀國(guó)內(nèi)外,不少因?yàn)榫W(wǎng)絡(luò)爬蟲(chóng)引發(fā)的案件,兩個(gè)公司之間打官司,公司員工被抓進(jìn)去等等,這些案例不勝枚舉。
國(guó)外案例
發(fā)生在美國(guó)一個(gè)起訴案件,在 F 公司 起訴 R 公司使用爬蟲(chóng)技術(shù)抓取了網(wǎng)站客戶(hù)的聯(lián)系方式,美國(guó)聯(lián)邦最高法院裁定抓取并轉(zhuǎn)載真實(shí)數(shù)據(jù)(比如電話(huà)清單)是允許的。在澳大利亞,發(fā)生的一類(lèi)似案件中,則裁定只有擁有明確作者的數(shù)據(jù),才可以受到版權(quán)的保護(hù)。
另一起發(fā)生于美國(guó)的美聯(lián)社起訴融文集團(tuán)的內(nèi)容抓取案件中,則裁定對(duì)美聯(lián)社新聞重新聚合為新產(chǎn)品的行為是侵犯版權(quán)的。此外,在歐盟發(fā)生的一個(gè)案件中,最終裁定定期抓取和深度鏈接是允許的。還有一些案件中,原告控告一些公司抓取強(qiáng)度過(guò)大,嘗試通過(guò)法律手段停止其抓取行為。在 Q 公司 訴訟 W 公司的案件中,裁定除非抓取行為造成了私人財(cái)產(chǎn)損失,否則不能被認(rèn)定為故意侵害,即使爬蟲(chóng)活動(dòng)導(dǎo)致了部分站點(diǎn)的可用性問(wèn)題。
這些案件告訴我們,當(dāng)抓取的數(shù)據(jù)是現(xiàn)實(shí)生活中真實(shí)的公共數(shù)據(jù)(比如,營(yíng)業(yè)地址、電話(huà)清單)時(shí),在遵守合理的使用規(guī)則的情況下是允許轉(zhuǎn)載的。但是,如果是原創(chuàng)數(shù)據(jù)(比如,意見(jiàn)和評(píng)論或用戶(hù)隱私數(shù)據(jù)),通常就會(huì)受到版權(quán)限制,而不能轉(zhuǎn)載。
無(wú)論如何,當(dāng)你抓取某個(gè)網(wǎng)站的數(shù)據(jù)時(shí),請(qǐng)記住自己是該網(wǎng)站的訪客,應(yīng)當(dāng)約束自己的抓取行為,否則他們可能會(huì)封禁你的 IP,甚至采取更進(jìn)一步的法律行動(dòng)。這就要求下載請(qǐng)求的速度需要限定在一個(gè)合理值之內(nèi),并且還需要設(shè)定一個(gè)專(zhuān)屬的用戶(hù)代理來(lái)標(biāo)識(shí)自己的爬蟲(chóng)。你還應(yīng)該設(shè)法查看網(wǎng)站的服務(wù)條款,確保你所獲取的數(shù)據(jù)不是私有或受版權(quán)保護(hù)的內(nèi)容。如果你還有疑慮或問(wèn)題,可以向媒體律師咨詢(xún)你所在地區(qū)的相關(guān)判例。
國(guó)內(nèi)案例
國(guó)內(nèi)相關(guān)條文與國(guó)外存在許多不同,如果您使用爬蟲(chóng)技術(shù)竊取個(gè)人隱私信息,或者公司的商業(yè)機(jī)密信息等,則真的會(huì)面臨牢獄之災(zāi),同時(shí)使用爬蟲(chóng)技術(shù)攻擊他人網(wǎng)站,造成他人網(wǎng)站宕機(jī),從而引起財(cái)產(chǎn)受到損失的也會(huì)受到相應(yīng)處罰。
2021 年10 月 15 日,北京市朝陽(yáng)公安分局對(duì)外公開(kāi),按照公安部“凈網(wǎng) 2021”專(zhuān)項(xiàng)行動(dòng)整體部署,朝陽(yáng)警方深入落實(shí)打擊網(wǎng)絡(luò)違法犯罪。
在市局網(wǎng)安總隊(duì)等有關(guān)部門(mén)的支持下,經(jīng)過(guò)半個(gè)多月的縝密偵查,將一個(gè)非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)的犯罪團(tuán)伙一網(wǎng)打盡,抓獲 23 名犯罪嫌疑人。據(jù)朝陽(yáng)警方稱(chēng),某購(gòu)物網(wǎng)站工作人員近期報(bào)警,其網(wǎng)絡(luò)購(gòu)物“直播間”存在異常訪問(wèn)情況,懷疑直播數(shù)據(jù)被非法竊取。
經(jīng)審訊,王某漪、楊某寧和楊某等人交代了他們利用“爬蟲(chóng)”軟件非法獲取網(wǎng)站數(shù)據(jù),進(jìn)行數(shù)據(jù)處理后倒賣(mài)獲利 40 余萬(wàn)元的犯罪事實(shí)。據(jù)悉,王某漪等人此前曾合伙創(chuàng)業(yè),但因經(jīng)營(yíng)不善沒(méi)有賺到錢(qián),心灰意冷之際,他們發(fā)現(xiàn)買(mǎi)賣(mài)購(gòu)物網(wǎng)站上的客戶(hù)信息可以賺大錢(qián),于是便走上了這條違法犯罪的不歸路。
2020 年 9 月份,河南商丘市睢陽(yáng)區(qū)人民法院的一份刑事判決書(shū),曝光了這起淘寶爬蟲(chóng)案件的細(xì)節(jié),涉及11億條用戶(hù)個(gè)人信息,數(shù)量之大,讓人大跌眼鏡。淘寶公司報(bào)警稱(chēng),有黑產(chǎn)通過(guò)mtop訂單評(píng)價(jià)接口,繞過(guò)平臺(tái)風(fēng)控批量爬取加密數(shù)據(jù),爬取字段量巨大,平均每天爬取數(shù)量 500萬(wàn),爬取內(nèi)容包括:買(mǎi)家用戶(hù)昵稱(chēng),用戶(hù)評(píng)價(jià)內(nèi)容,昵稱(chēng)等敏感字段。
警方將該案立為刑事案件。因涉嫌非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)、非法控制計(jì)算機(jī)信息系統(tǒng)罪,2020年8月15日,逯某被商丘市公安局新城分局刑事拘留,2020年9月22日被逮捕。6天后,也就是8月21日,因涉嫌侵犯公民個(gè)人信息罪,黎某被抓獲,并于2020年8月22日被商丘市公安局新城分局刑事拘留,9月22日被逮捕。
最終,法院判定:被告人黎某犯侵犯公民個(gè)人信息罪,判處有期徒刑三年六個(gè)月,并處罰金人民幣三十五萬(wàn)元;被告人逯某犯侵犯公民個(gè)人信息罪,判處有期徒刑三年三個(gè)月,并處罰金人民幣十萬(wàn)元。
總結(jié)
通過(guò)上述案例,我們應(yīng)該牢記一點(diǎn),一定要遵守爬蟲(chóng)的使用規(guī)范、禮儀,切記不要做損害他人利益、抓取個(gè)人隱私的事情,否則真的要“牢底坐穿”。同時(shí)還要注意國(guó)內(nèi)外對(duì)爬蟲(chóng)的限制存在不同,在國(guó)內(nèi)要遵守網(wǎng)絡(luò)安全法。
總結(jié)
以上是生活随笔為你收集整理的论Python爬虫是否合法(一定要看看)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 广东省智慧高速公路建设指南
- 下一篇: Python可以开发软件吗?Python