你放在 LinkedIn 上的資訊失去保護!法院裁定 AI 爬蟲程式合法!

相信不少在職人士都在用 Linkedin ,這是一個求職或是獵頭的好地方,然而把自己的資訊放到網絡上,未免還是有一點風險的。早前 HiQ 利用爬蟲程式截取 LinkedIn 上面的用家資料,並號稱用作 AI 訓練用途,後來他們和 Linkedin 鬧上法院了,直到今日法官裁定 HiQ 勝訴,他們有權在 Linkedin 上爬資料。

法院裁定 HiQ 有權在 LinkedIn 上爬蟲 資料不再安全?

早前一家數據分析公司 HiQ 利用爬蟲程式在 LinkedIn 上面爬取用家資料,在五月的時侯 LinkedIn 要求對方內例止行動,並發出了一封公開信,直指對方侵犯平台上的用家,並違反用家條款,甚至違反了 CFAA (Computer Fraud and Abuse Act )

這個事件被一位哈佛法律系教授 Laurence Tribe 關注,而後來在 Jolt Digest 上面裁定這家公司只進行公開資訊的爬蟲,並無跡象指他們嘗試尋找一些私人的資料,故此指控並不成立。在裁決之後, LinkedIn 決定要上訴,根據 LinkedIn 的發言人所說:「我們對法院的裁決相當失望,但這並不代表完結,我們將會保護在平台上面的所有會員,同時要悍衛他們決定放什麼資訊上 LinkedIn 的權利。」

但很可惜,這些資料是用家決定公開的,對於他們的指控來說並不是很有力的證據。我們再想想,如果我們有足夠的人力,也可以在 LinkedIn 上面找到公開的資料,再 Copy & Paste ,HiQ 就是利用爬蟲程式去做到這一點,當然我們知道每一個網站都有 robot.txt 去決定是否封截爬蟲程式,然而要爬的方法實在太多太多。

事實上,Facebook 在 2010 年曾經向一位工程師提告 內容亦指對方侵犯用戶私隱,雖然最後沒有鬧得很大,但這次事件令我們明白到公開自己的資料,只會讓全世界的程式能抓取它,而這是很難的事嗎?TechApple 的編輯練習兩星期也能用 Python 和 BeautifulSoup 寫出爬蟲去分析網站了,很難說以後會不會普及。

引用來源:The Next Web

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *

限制時效已用盡。請重新載入驗證碼。