跳至主要内容

17歲輟學,5年進OpenAI:用ChatGPT學會博士級AI

拆解Gabriel的"自頂向下學習法",提供可複製的學習框架

Learning with AI

2024年12月,OpenAI的Sora團隊來了個新人。

22歲。瑞典人。高中輟學,沒有學位。

職位是Research Scientist(研究科學家)——這個職位傳統上只有博士才能做。

他叫Gabriel Petersson。

兩週前(2025年11月28日),他在Extraordinary播客上公開分享了自己的故事。我聽完之後,第一反應是:這不可能。

17歲輟學,22歲進OpenAI做研究。

中間只有5年。

沒有大學。沒有導師。沒有實驗室。

他是怎麼做到的?

答案很簡單,也很瘋狂:他用ChatGPT,把自己從零基礎訓練成了博士級AI工程師。

今天我想深入拆解他的學習方法。不是勵志雞湯,而是可複製的框架。


一、傳統學習路徑:為什麼需要10年?

先說傳統路徑。

如果你想成為OpenAI Sora團隊的研究科學家,正常路徑是什麼?

標準路徑

  • 4年本科(計算機/數學/物理)
  • 2年碩士(機器學習方向)
  • 3-5年博士(影片生成/擴散模型研究)
  • 可能還需要1-2年博後

加起來至少10年。

這10年在幹什麼?

第一階段:打基礎(4-6年)

你要學高等數學、線性代數、機率論、資料結構、演算法、計算機體系結構...

這些是基礎。

你不懂這些,就看不懂論文,寫不了程式碼,跑不了模型。

所以你得先學。

第二階段:專業化(2-3年)

基礎打好了,開始學專業課。

機器學習、深度學習、計算機視覺、自然語言處理...

每門課都有一堆公式、演算法、論文。

你得一個個啃下來。

第三階段:做研究(3-5年)

前面7-8年學的都是別人的成果。

現在你要做自己的研究了。

選方向、讀論文、跑實驗、寫論文...

運氣好的話,3年畢業。運氣不好,5年也正常。

為什麼這麼慢?

因為傳統教育是**自底向上(Bottom-Up)**的。

先學微積分,再學線性代數,再學機率論...

先打地基,再建框架,最後蓋樓。

邏輯很嚴密。但問題是:

你學了3年微積分,可能還不知道它能幹嘛。

你學了5年程式設計,可能還沒做出一個真正能用的產品。

知識和應用,脫節太久了。

很多人學到一半,就放棄了。因為看不到意義。


二、Gabriel的路徑:自頂向下,5年夠了

Gabriel走的是完全相反的路。

他不是先學理論,而是先做東西。

2019年。17歲。輟學。

加入Depict.ai(YC孵化的創業公司),創始團隊成員。

第一個任務:做產品推薦系統。

他完全不懂機器學習,甚至不太會寫程式碼。

但他必須做出來。因為這是工作。

怎麼辦?

Step 1: 從問題開始

Gabriel沒有去翻《機器學習導論》。

他直接問ChatGPT:"我該做什麼專案?"

ChatGPT告訴他:你可以做個產品推薦系統。

然後他又問:"怎麼做?"

ChatGPT給了他一個初始程式碼框架。

Step 2: 讓AI生成程式碼

Gabriel沒有完全理解這些程式碼。

但他先跑起來再說。

程式碼有bug?沒關係,問ChatGPT怎麼修。

缺少某個庫?問ChatGPT怎麼裝。

不懂某個函式?問ChatGPT是什麼意思。

他沒把自己當學生。他是在解決實際工作問題。

Step 3: 逐行研究程式碼

專案跑通了,但Gabriel沒有停。

他開始逐行研究程式碼。

這個函式是幹嘛的?為什麼要這麼寫?背後的原理是什麼?

不懂的地方,繼續問ChatGPT。

遇到數學公式,讓ChatGPT解釋。

遇到ML概念,讓ChatGPT講清楚。

Step 4: 遞迴地向下鑽取

Gabriel用了一個很形象的說法:

"你從問題開始,遞迴地向下鑽取。"

什麼意思?

你不是從理論開始往上堆。而是從實際問題往下挖。

遇到不懂的,就往下挖一層。再遇到不懂的,再往下挖一層。

直到你真正理解了。

案例:如何學習擴散模型

Gabriel後來加入Midjourney,開始接觸影象生成。

他想學擴散模型(Diffusion Model)——這是DALL-E、Stable Diffusion、Sora的核心技術。

傳統路徑是什麼?

  1. 先學機率論、統計學
  2. 再學貝葉斯推斷
  3. 再學生成模型理論
  4. 再學擴散模型論文
  5. 最後才動手寫程式碼

可能需要1-2年。

Gabriel怎麼做?

  1. 找到擴散模型的開原始碼(比如Stable Diffusion)
  2. 逐行閱讀程式碼
  3. 遇到不懂的數學符號,問ChatGPT
  4. 遇到不懂的演算法,問ChatGPT
  5. 邊改程式碼邊理解原理
  6. 在實際專案中應用和改進

可能需要幾周到幾個月。

關鍵區別是什麼?

傳統路徑:理論→理論→理論→實踐

Gabriel路徑:實踐→理論→實踐→理論

知識和應用,隨時在驗證。


三、為什麼這種方法現在可行?

Gabriel不是第一個想這麼學的人。

很多人都試過"邊做邊學"。

但為什麼現在才有Gabriel這樣的案例?

因為有三個關鍵變化。

變化1:ChatGPT成為了真正的導師

2022年11月之前,你想自學AI,只能靠搜尋引擎(找到答案要翻10頁)、Stack Overflow(問題太具體沒人回答)、論文(看不懂沒人解釋)。

2022年11月之後,情況變了。

ChatGPT出來了。它能解釋任何概念,從最基礎到最前沿。能生成程式碼,並且解釋每一行在幹嘛。能除錯錯誤,告訴你哪裡錯了為什麼錯。你缺什麼數學背景,它就教什麼。

Gabriel的原話:

"Universities don't have, like, a monopoly on foundational knowledge anymore. You can just get any foundational knowledge from ChatGPT."

大學不再壟斷基礎知識。你可以從ChatGPT獲得任何基礎知識。

這句話聽起來很狂。但確實如此。

我自己用Claude Code做開發時,也有這種感受。很多時候,我甚至覺得Claude比大學老師講得還清楚。

不是說大學老師不行。而是AI有幾個獨特優勢:

根據你的水平調整解釋深度。你是小白,它就講得簡單點。你是進階,它就講得深入點。

無限耐心地回答你的重複問題。同一個問題問10遍,它也不會煩。

24/7隨時可用。凌晨3點卡住了,也能問。

變化2:創業門檻降到史上最低

Sam Altman(OpenAI CEO,自己也是斯坦福輟學生)在2025年10月說:

"I'm envious of the current generation of 20-year-old dropouts. The amount of stuff you can build, the opportunity in this space is so incredibly wide."

我嫉妒現在這一代20歲的輟學生。你能構建的東西數量、這個領域的機會是如此之廣。

為什麼?

AI降低了創新門檻。

以前做個推薦系統,你需要招一個ML工程師、買一堆伺服器、訓練模型、部署上線。

現在呢?直接用現成的API就行。OpenAI、Anthropic、阿里雲百鍊...都有。

甚至可以讓ChatGPT幫你寫程式碼、部署、測試。全程都能輔助。

小團隊,甚至個人,都能做出以前大公司才能做的東西。

這就是Gabriel的機會。

他17歲加入Depict.ai時,整個團隊都是17-18歲的輟學生。

但他們做出來了。因為工具夠強大。

變化3:公司更看重能力,而不是學歷

Gabriel說:

"公司現在更看重結果和生產能力,而不是正式資格。最重要的是解決問題和創造價值。"

這不是他一個人的觀點。

Y Combinator的資料:

  • 兩年前,YC孵化的創業公司中,只有10%是學生或應屆畢業生
  • 2025年,這個比例漲到了30%

Andreessen Horowitz(矽谷頂級VC)直接說:

"這是十年來大學輟學生創業的最佳時機。"

為什麼?

因為AI讓"學位"和"能力"脫鉤了。

以前,學位是能力的證明。你沒學位,公司怎麼知道你行不行?

現在,GitHub是能力的證明。你做過什麼專案、貢獻過什麼開原始碼,一看就知道。

Gabriel進OpenAI,不是因為他有學位。

而是因為他做出了東西。

在Midjourney做了世界上最高效能的Web影象網格。在Dataland做了最高效能的Web表格。

程式碼和產品,就是最好的簡歷。


四、這種方法適合誰、不適合誰?

看到這裡,你可能會想:我也可以這樣學嗎?

答案是:不一定。

Gabriel的方法不是萬能的。它有適用場景。

✅ 適合的場景

1. 快速迭代的工程領域

軟體開發、AI工程、產品設計...

這些領域的特點是:

  • 錯了可以立即調整(不會有生命危險)
  • 有明確的反饋(程式碼要麼跑通,要麼報錯)
  • 開源資源豐富(GitHub上一堆程式碼可以學)

2. 目標明確的技能學習

你知道自己要做什麼(比如做個推薦系統、搞個影片生成工具)。

不是為了學習而學習。是為了做出來。

3. 有極強執行力的人

Gabriel17歲輟學,加入創業公司。

工作壓力巨大,必須快速出成果。

這種壓力,反而成了學習的驅動力。

如果你沒有外部壓力,很可能三天打魚兩天曬網。

❌ 不適合的場景

1. 需要系統性基礎的領域

理論物理、純數學、基礎科學研究...

這些領域的特點是:

  • 錯誤理解會導致嚴重後果
  • 需要長期積累和深度思考
  • ChatGPT的知識可能不夠前沿

2. 需要嚴格認證的專業

醫學、法律、建築...

這些領域不是你會做就行,還要有執照、認證。

你不能用ChatGPT學了3個月,就去給人看病。

3. 缺乏自驅力的人

如果你需要老師監督、同學陪伴、考試督促,傳統教育可能更適合你。

自學需要極強的自律和執行力。

Gabriel成功的其他因素

說實話,Gabriel的成功不只是因為ChatGPT。

還有很多其他因素。

運氣和時機。2019年輟學,正好趕上AI創業浪潮。如果早10年,可能沒這個機會。

環境和資源。矽谷/舊金山的創業環境,YC生態系統的支援,接觸到頂尖團隊和專案。這些都是加分項。

個人特質。極強的執行力(17歲就敢輟學),願意承擔風險,能在高壓環境下快速成長。

這些都是ChatGPT教不了的。


五、給你的3個行動建議

如果你想借鑑Gabriel的方法,該怎麼開始?

建議1:選一個"略高於當前能力"的專案

不要選太簡單的(學不到東西)。

也不要選太難的(做不出來會放棄)。

標準是什麼?你大概知道怎麼做,但需要學一些新東西才能做出來。

舉幾個例子:

會Python?試著做個Web爬蟲。

會前端?接入OpenAI API做個聊天介面。

會資料分析?用機器學習做個預測模型。

關鍵是有具體的產出目標。不是學習XX技術,而是做出XX東西。

建議2:用ChatGPT/Claude,但別完全依賴

ChatGPT能幫你生成初始程式碼、解釋不懂的概念、除錯錯誤、補充背景知識。

但你自己要做三件事:

第一,逐行理解程式碼。別直接複製貼上。

第二,驗證AI的回答。AI也會犯錯。

第三,深入底層原理。知道為什麼,不只是怎麼做。

我自己用Claude Code寫程式碼時,有個習慣:

AI生成程式碼後,我會逐行閱讀,理解每一行在幹嘛。遇到不懂的,追問到底。

這個過程,就是學習。

建議3:做出來,放到GitHub上

不要只是"學會了"。

要有實際產出。

做個小專案,放到GitHub上。

即使很簡陋,也是你的作品。

為什麼?

一是強制你做完。不是學一半就放棄。

二是可以獲得反饋。別人的評論、Issues、PRs,都是學習機會。

三是成為你的簡歷。比學歷更有說服力。

Gabriel進OpenAI,不是因為他有學位。

而是因為他在Midjourney、Dataland做出了世界級的產品。

程式碼和產品,就是最好的證明。


六、學位的價值正在改變

寫到這裡,我想說清楚一件事:

Gabriel的故事不是在鼓勵你輟學。

輟學是極端選擇,風險巨大。

Gabriel成功了,但可能有一萬個輟學生失敗了。

這篇文章想說的是:

學習方式正在改變。

以前,學位是知識的唯一通道。

現在,AI讓自學成為可能。

以前,學位是能力的唯一證明。

現在,作品和程式碼也能證明你的能力。

學位不是沒用,而是不再唯一。

如果你在讀大學,不用焦慮。

大學提供的不只是知識。還有系統化的訓練、人脈和資源、相對安全的試錯環境。這些都很valuable。

如果你已經工作,想轉型AI,也不用回去讀學位。

你可以用Gabriel的方法。選個專案,邊做邊學,用ChatGPT補充知識,做出作品證明自己。

關鍵不是學位,而是持續學習的能力。

AI時代,技術更新太快了。

你今天學的,可能明年就過時。

比學歷更重要的,是你能不能快速學會新東西。

Gabriel17歲學會了推薦系統。18歲學會了資料視覺化。20歲學會了影象生成。22歲學會了影片生成。

他不是天才。

只是找到了高效學習的方法。

這個方法,你也可以用。


如果你想了解更多Gabriel的故事,可以聽他在Extraordinary播客上的分享(2025年11月28日)。

如果你對AI學習有自己的經驗,歡迎在評論區分享。