Verification: 536556f5b980ded7

誰是 Jakub Pachocki?揭秘 OpenAI 新任首席科學家與他的「絕對計算」帝國

矽谷的風暴中心,往往也是最安靜的地方。

2024 年 5 月,當 AI 圈的精神領袖 Ilya Sutskever 轉身離開 OpenAI 時,全世界的目光都聚焦在那張空出來的椅子上。誰能接住這把火炬?誰有資格定義下一代人工智慧的靈魂?答案隨即揭曉:Jakub Pachocki

如果你對這個名字感到陌生,那很正常。與經常在推特上活躍的科技大亨不同,Jakub Pachocki 是一股潛流。他是那種在程式碼與數學公式中尋找真理的人,沈默,卻致命地精準。

今天,我們不僅要拆解這位被 Sam Altman 譽為「我們這一代最傑出人才」的成長軌跡,更要將他與 Google 的傳奇人物 Jeff Dean 並列,看見這場世紀 AI 對決背後的「人」的因素。

來自波蘭的運算機器:在極限中尋找最優解

Jakub Pachocki 的故事,必須從波蘭說起。

波蘭,格但斯克 (Gdańsk),1991 年。這個國家擁有全球最硬核的數學與資訊教育體系。在這個環境下長大的 Jakub,從青少年時期就展現出一種令人恐懼的特質:對「解題」的純粹執著

他不是一般的資優生,他是競賽場上的獵人。

數據不會說謊。Jakub 是 IOI(國際資訊奧林匹亞) 的常客,六次殺入決賽 [^1]。在大學時期,他代表華沙大學出征被譽為「程式設計界世界盃」的 ICPC(國際大學生程式設計競賽)。雖然早期的草稿常誤植年份,但在 2012 年,正是他帶領團隊奪下了全球亞軍金牌,這場戰役奠定了他「競賽神童」的地位 [^2]。

這段經歷給了他什麼?一種刻在骨子裡的直覺——在極端受限的資源下(時間、記憶體),如何榨出演算法的最後一滴效能。這不僅僅是為了贏,這是為了生存。這種思維,恰恰是十年後訓練 GPT-4 時最需要的武器。

進入 OpenAI:從 Dota 2 到 GPT-4 的工程救星

2017 年,剛從卡內基梅隆大學 (CMU) 拿到博士學位的 Jakub Pachocki,沒有選擇安穩的教職,而是跳進了當時還顯得有些理想主義的 OpenAI。

第一戰:教 AI 打電動

他的成名作並非語言模型,而是遊戲。在 OpenAI Five 專案中,Jakub 負責核心的強化學習(Reinforcement Learning)演算法。

這不是簡單的「打贏人類」,這是在證明 AI 可以透過「自我對弈」學會長期的戰略規劃。當 OpenAI Five 在 Dota 2 的複雜戰場上碾壓世界冠軍時,Jakub 證明了一件事:只要獎勵機制設計得當,機器的推理能力沒有上限。

GPT-4 的幕後推手

但真正讓他在內部封神的,是 GPT-4。

外界看到的是 ChatGPT 的流利對答,但在圍牆之內,訓練像 GPT-4 這樣的巨型模型是一場工程災難。數千張 GPU 同時運作,硬體故障、梯度爆炸、收斂失敗是家常便飯。

此時的 Jakub Pachocki,不僅是科學家,更是戰地指揮官。他主導了預訓練工作,並解決了著名的「訓練崩潰」問題。他不僅僅是調整參數,他是重新設計了分散式訓練的架構,確保了 Ilya Sutskever 提出的 Scaling Laws(縮放定律)能夠在物理世界中落地 [^3]。

沒有 Jakub 的工程魔法,GPT-4 可能至今仍只是一個寫在白板上的數學構想。

接棒首席科學家:o1 模型與推理的未來

2024 年 5 月,隨著 Ilya Sutskever 的離職,Jakub Pachocki 正式接任 OpenAI 首席科學家。

這不僅是人事變動,更是路線的宣示。如果說 GPT-3.5 是教會 AI「說話」,那麼 Jakub 領導的 o1 系列模型(原代號 Q* 或 Strawberry)則是教會 AI「思考」。

他引入了「思維鏈」(Chain of Thought)與強化學習的深度結合。現在,當你問 AI 一個複雜問題,它不再是條件反射式地吐出下一個字,而是會先在內部進行邏輯推演、自我修正,然後才給出答案。這就是 Jakub 的標誌性風格:深度推理 (Deep Reasoning)

他正在領導團隊攻克的,是如何打破 AI 的「幻覺」與邏輯謬誤。他的目標很明確:打造一個不僅知識淵博,而且邏輯嚴密的大腦。


另一個維度的巨人:Jeff Dean 與 Google 的反擊

在矽谷的另一端,有一位與 Jakub Pachocki 截然不同,卻同樣偉大的對手——Jeff Dean

如果說 Jakub 是專精於演算法與推理的「刺客」,那麼 Jeff Dean 就是打造了整個數位世界的「泰坦」。

Google 第 30 號員工的傳奇

生於 1968 年的 Jeff Dean,資歷深厚得驚人。作為 Google 的第 30 號員工 [^4],他幾乎憑一己之力(當然還有他的搭檔 Sanjay Ghemawat)構建了現代網路的底層。

MapReduce、BigTable、Spanner——這些聽起來生硬的技術名詞,是你今天能順暢使用 Google 搜尋、Gmail 的基石。在 Google 內部流傳著關於他的「Chuck Norris 式」笑話:「編譯器從不警告 Jeff Dean,只有 Jeff Dean 警告編譯器。」

軟硬體的一體化

Jeff Dean 的恐怖之處在於他的全知全能。他懂分散式系統,懂資料庫,更懂 AI。

  • TensorFlow: 他意識到舊有的工具限制了深度學習的發展,於是推動了 TensorFlow 的誕生。
  • TPU (張量處理單元): 當摩爾定律放緩,他早在 2013 年就推動 Google 自研 AI 晶片。這讓 Google 擁有全球最強大的 AI 算力基礎設施。

2023 年,為了應對 OpenAI 的挑戰,Google 將 Brain 與 DeepMind 合併。Jeff Dean 擔任新組織的首席科學家,親自操刀 Gemini 模型架構 [^5]。這是一場「演算法天才」對決「系統架構之神」的戰爭。

兩種天才,一個未來

Jakub Pachocki 與 Jeff Dean,代表了 AI 發展的兩個關鍵維度。

Jakub 代表著 「深度」——他在探索演算法如何能像人類一樣進行複雜的邏輯推理,試圖用數學解開意識的謎題。
Jeff Dean 代表著 「廣度」與「基石」——他構建了能承載這些巨大模型的數位骨架,確保 AI 能在規模化中存活。

2025 年及以後,隨著 Jakub Pachocki 帶領 OpenAI 衝擊 GPT-5,以及 Jeff Dean 整合 Google 的全部算力資源,我們有幸見證這場人類智慧頂峰的較量。

無論誰勝誰負,歷史都已經被他們改寫。


參考文獻

[^1]: IOI Statistics. “Jakub Pachocki Hall of Fame”. International Olympiad in Informatics.
[^2]: ICPC Results. “The 2012 World Finals”. ICPC.
[^3]: OpenAI Blog. “Research about GPT-4”. OpenAI.
[^4]: Google Research. “Jeff Dean – Senior Fellow”. Google.
[^5]: Alphabet Investor Relations. “Google DeepMind Merger Announcement, April 2023”.

發表迴響

探索更多來自 YOLOLab - 你只活一次實驗室 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading