fbpx

「一開始我就相信這是可行的」:卷積神經網絡之父 Yann LeCun

過去 20 年互聯網高速發展,產生了大量需要被處理的數據,而這些數據讓人類處理,因此人工智能成為大熱。在某種程度上來說,人工智能已經充斥著我們生活的各個角落了。

其中 AI 圖像識別是一個人工智能中熱門課題,而 Yann LeCun 研發的卷積神經網絡是應用於圖像識別的主要技術。

以反向傳播算法學習算法為研究方向

出生在巴黎的 Yann LeCun 在 1987 年 從巴黎第六大學修讀計算機科學博士時,以神經網絡的反向傳播算法學習算法為主要研究方向。

但許多在那時候研究人工智能的人,例如深度學習之父 Geoffrey Hinton 等,都在面臨極大的困難。當時,整體科學界對 AI 研究走向沉寂,大家所投入的興趣、資金均大幅減少。

一方面,那時候電腦的運算能力還遠達不到要求。 早期的軟體驅動器在複雜程度上與現代的智慧型手機相比是小巫見大巫,電腦晶片在 1989 年以前也容納不了數百萬個組件,現今這個數字可以達到 80 億。

另一方面,人工智能的研發亦到達樽頸,研究人員取得的成果無法達到最初設想之後,令人們開始覺得人工智能不可行而開始放棄。

甚至在讀博士的時候, LeCun 的導師對神經網絡一無所知,他就說:「我可以給你的論文簽字,你似乎挺聰明的,但是從技術角度講我確實沒辦法幫助你。」

但 Yann LeCun 沒有像其他人一樣對人工智能抱持悲觀的心態,相反,他在畢業後加入了美國新澤西州 Holmdel 的 AT&T 貝爾實驗室的自適應系統研究部,在那裡他開發了許多新的機器學習方法,包括改變了 AI 圖像識別的卷積神經網絡。

卷積神經網絡

卷積神經網絡(Convolutional Neural Network, CNN)對比深度學習神經網絡(DNN)多了Convolutional(卷積)及池化(Pooling) 兩層,用以維持形狀資訊並且避免參數大幅增加。

卷積層由小型傳感器互聯形成的系統把圖像等內容分解成非常細小的部分,在每個部分中提取出圖像的不同特徵,並識別出其中的模式。

而池化層的功能就是將輸入的圖片尺寸縮小(大部份為縮小一半)以減少每張feature map維度並保留重要的特徵最後根據所有的輸入數據確定它們看到了什麼。

它的人工神經元可以響應一部分覆蓋範圍內的周圍單元,對於大型圖像處理有出色表現,因此與其他深度學習結構相比,卷積神經網絡在圖像和語音辨識方面能夠給出更好的結果。

相比較其他深度、前饋神經網絡,卷積神經網絡需要考量的參數更少,使之成為一種頗具吸引力的深度學習結構。

相信自己的方向 並一直堅持下去

雖然他在90年代已經提出了這個網絡,但這個神經網絡並沒有在那個時候得到廣泛的應用。

他們當時將卷積神經網絡應用到支票識別系統中,正當他們準備出現成果時,AT&T 被拆分成了三個公司,AT&T、朗訊和 NCR,當時卷積網絡的專利被分給另一個公司,沒法繼續開發這個技術,令他們失去了所有字符識別方面的研究成果。

但 Yann LeCun 卻沒有放棄。他曾在訪談中表示:「一開始我就相信這是可行的,雖然它需要運算很快的計算機和很多數據,但我一直相信這是一種正確的做法。」

「我喜歡做的事,而且可能還是我做的不錯的一件事,就是一直向下挖掘,去發現一個疑問背後真正的問題是什麼。」

在 2012 年的時候,Geoff Hinton 領軍的研究團隊在 ImageNet 競賽中以深度學習技術寫下圖片辨識率達85%的新紀錄並獲得冠軍,而在前一屆2010年的競賽中,辨識率最高僅72%,這讓諸多研究者看到深度學習的技術潛力,也讓處於寒冬數十載的人工智慧迎來曙光。

從此之後,計算機視覺在進入出現了爆炸式增長。計算機開始學會識別圖像中的物體,接著又能識別視頻中的物體,最後又發展到能夠識別攝像頭拍攝的實時畫面中的物體。

目前 LeCun 不僅保留着紐約大學(NYU)的教職,而且也是 Facebook 人工智能實驗室(FAIR)的負責人。

資料來源:維基YannLeCun

Sophia

Tech 小編修習進行中的小小薯學生。聯絡電郵:sophia@techapple.com

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *

限制時效已用盡。請重新載入驗證碼。