如果你聽過 Vibe Coding 那你一定要認識他的父親 Alex Krizhevsky

如果人工智慧的歷史是一條長河,2012 年以前,這條河是冰封的。

打破冰層的不是科技巨頭的 CEO,也不是站在鎂光燈下的演說家,而是一位當時在多倫多大學攻讀博士的烏克蘭裔青年——Alex Krizhevsky。當時他跟 Geoffrey Hinton 還有 Ilya Sutskever 用幾千行 CUDA 程式碼和兩張消費級顯示卡,不僅贏得了一場比賽,更強行將世界拖入了深度學習(Deep Learning)的黃金時代。

但他卻在聲勢最鼎盛時,選擇了轉身離開。

這不僅僅是關於技術規格的故事,這是一部關於直覺、堅持,以及天才如何面對自己創造出的巨獸的現代啟示錄。

冰原上的火種:AlexNet 前夜

要把時間撥回 2010 年代初期。那時候的電腦視覺領域(Computer Vision),是一片由手工特徵工程統治的「蠻荒之地」。

學界的主流聲音並不看好神經網路。大多數研究者埋首於 SIFT 和 HOG 等演算法,試圖教電腦「看懂」圖片的邊緣和紋理。雖然神經網路的概念早在 1940 年代就被提出,但在當時,它被標籤為「無法訓練」、「過於緩慢」且「理論不清」的黑盒子。

Alex Krizhevsky 並不這麼想。

在被譽為「深度學習教父」的 Geoffrey Hinton 指導下,Krizhevsky 與同窗 Ilya Sutskever(後來 OpenAI 的聯合創始人)組成了一個只有三人的特攻隊。他們的目標很單純:在 ImageNet 大規模視覺識別挑戰賽(ILSVRC)上,證明深層神經網路不僅可行,而且能碾壓傳統方法。

這在當時被視為一種瘋狂的賭注。

2012 年的奇點:AlexNet 的暴力美學

2012 年 9 月 30 日,這一天在 AI 史冊上應被紅筆圈起。

Alex Krizhevsky 所設計的卷積神經網路(CNN)——後來被世人稱為 AlexNet 以一種近乎羞辱對手的方式奪冠。

  • AlexNet 錯誤率:15.3%
  • 第二名(傳統方法):26.2%

兩者之間存在著高達 10.8 個百分點的鴻溝[^1]。在頂級學術競賽中,通常進步 0.1% 就值得開香檳慶祝,而 Krizhevsky 直接將效能提升了一個量級。這不是進步,這是屠殺。

技術心臟:他如何做到的?

AlexNet 的成功,很大程度上歸功於 Krizhevsky 對底層運算的極致掌控。不同於當時依賴 CPU 的主流做法,他展現了一種「暴力美學」:

  1. GPU 加速的先驅:他親手用 CUDA/C++ 撰寫了名為 cuda-convnet 的程式庫。他在兩張 NVIDIA GTX 580 顯示卡(每張只有 3GB 記憶體)上並行訓練模型。這種硬體限制迫使他設計出將神經網路切分到兩張卡上運行的創新架構。這一舉動,直接開啟了 NVIDIA 的 AI 霸業[^2]。
  2. ReLU 活化函數:他捨棄了傳統的 sigmoid 或 tanh,選用了 ReLU(Rectified Linear Unit)。這個簡單的數學改動解決了梯度消失(Vanishing Gradient)的千古難題,讓訓練速度快了六倍。
  3. Dropout 正規化:為了防止這個擁有 6000 萬參數的巨獸「死記硬背」(Overfitting),他引入了 Dropout 技術,隨機關閉神經元,迫使網路學習更強健的特徵。

這一系列操作,成為了後來 VGG、ResNet 乃至現代 Transformer 模型的基石。

矽谷的爭奪戰與 Google 歲月

AlexNet 發布後,學術界的質疑聲瞬間消失,取而代之的是矽谷巨頭揮舞著支票簿的瘋狂。

Krizhevsky 和他的團隊迅速成立了 DNN Research Inc.。這家公司沒有產品,沒有營收,只有三個人和幾篇論文。但這並不妨礙 Google、Microsoft 和 Baidu 展開競標。最終,Google 收購了這家公司,Alex Krizhevsky 正式披上 Google 的戰袍。

然而,這段「童話故事」並沒有按照標準的劇本發展。

在 Google Brain 工作期間,Krizhevsky 雖然持續產出高品質論文,但外界能感受到他的熱情似乎在逐漸冷卻。與積極在媒體曝光的 Ilya Sutskever 不同,Krizhevsky 顯得異常低調,甚至有些隱士的氣質。

離開與沉默:天才的去向

2017 年 9 月,一則簡短的消息震驚了 AI 圈:Alex Krizhevsky 離開了 Google

根據當時的報導,他離開的原因是因為對當時的工作「失去了興趣」(lost interest)^3。這句輕描淡寫的理由背後,或許隱藏著一位純粹研究者對大型科技公司KPI導向文化的抗拒,亦或是他對深度學習發展瓶頸的某種預判。

從 Dessa 到隱形

離開 Google 後,他短暫地加入了 AI 新創公司 Dessa(前身為 DeepLearni.ng),致力於開發新的深度學習工具。然而,隨著 Dessa 被 Square(現 Block Inc.)收購,Krizhevsky 的公開蹤跡變得更加模糊。

目前的資料顯示,他似乎已轉向投資者角色,或是在進行非公開的獨立研究。對於許多追隨者來說,這是一種遺憾;但對於像 Krizhevsky 這樣的人來說,這或許才是常態——他在完成「從 0 到 1」的爆破後,便對「從 1 到 100」的修繕工作意興闌珊。

遺產:他不只留下了 AlexNet

當我們談論 Alex Krizhevsky 時,如果不提及 CIFAR-10CIFAR-100,那這幅畫像是不完整的。

這兩個由他創建的資料集,至今仍是機器學習領域的「果蠅」是檢驗任何新演算法效能的標準試金石。無數的學生、研究員用著他的資料集,跑著基於他架構改良的模型,但他本人卻已退居幕後做教育的角色。

Alex Krizhevsky 的故事不僅僅是技術勝利,它更像是一則關於「時勢造英雄」與「急流勇退」的現代寓言。

他證明了直覺的重要性,在所有人都在做特徵工程時,他相信神經網路;在所有人都用 CPU 時,他擁抱了 GPU。今天的 ChatGPT、Midjourney、甚至是自動駕駛技術,血管裡都流著 AlexNet 的基因。

他點燃了火,然後悄然離場,留給世界一個無限燃燒的 AI 時代。


**參考文獻:** [^1]: Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). ImageNet classification with deep convolutional neural networks. *Advances in neural information processing systems*, 25. [^2]: NVIDIA Blog. (2012). “Accelerating AI with GPUs: The AlexNet Breakthrough.”


探索更多來自 YOLO LAB|解構科技邊際與媒體娛樂的數據實驗室 的內容

訂閱即可透過電子郵件收到最新文章。