跳至主要内容

💬 什麼是ChatGPT

關於ChatGPT的幾個基礎事實:

  • ChatGPT的官方網址是:https://chat.openai.com/chat 。該介面是一個非常簡潔的對話工具,你可以輸入任何你想聊天或諮詢的問題與其對話;

目前並沒有官方的ChatGPT應用程式。任何聲稱與ChatGPT相關的app、電腦客戶端或其他網站可能都是基於OpenAI的API介面開發的,或者是虛假的,請注意甄別;

  • ChatGPT由OpenAI公司開發,要使用它,你需要擁有一個OpenAI網站的賬戶。想要註冊賬戶,你需要滿足兩個條件:首先,你需要透過科學上網🪜訪問他們的網站 https://openai.com/; 其次,在註冊過程中,你需要使用非中國大陸的手機號接收驗證碼完成確認(這一步可能會困擾許多人,我將在下一篇文章中詳細介紹如何操作);

  • ChatGPT隸屬於OpenAI公司,該公司成立於2015年。近期,微軟投資了數十億美元,成為其大股東。因此,你可能會在網際網路上看到許多關於微軟與這個產品的相關資訊,例如他們於3月16日釋出的辦公智慧助手CoPilot。

接下來進入正題聊聊到底什麼叫ChatGPT,拆解下他們是怎麼被做出來的。

一、ChatGPT簡介

首先,ChatGPT 是由 OpenAI 開發的自然語言處理(NLP)模型,基於 GPT-3 及之後的架構,並專門最佳化了與人類使用者的互動對話。我們可以將其分解為:

Chat:聊天,意味著模型主要用於與人類使用者進行互動對話。

GPT:代表 "Generative Pre-trained Transformer",即模型的核心架構。

  • G(Generative):生成式,表示模型能生成新內容,如文字、答案等。

  • P(Pre-trained):預訓練,意味著模型在大量文字資料上進行了預訓練,能理解和生成自然語言。

  • T(Transformer):轉換器,一種用於自然語言處理任務的神經網路架構。它在2017年的一篇論文中被提出,被OpenAI應用於GPT模型。該架構具有強大的並行處理和注意力機制。

綜上,ChatGPT 是一個生成式預訓練轉換器模型,經過最佳化實現與人對話。目前,谷歌的BERT模型也使用了Transformer架構,這是當前NLP領域最主流的模型架構,也是大型模型訓練的基礎。

二、GPT模型的發展歷程

GPT模型自2018年問世以來,引數規模不斷擴大。最新的GPT-4比第一代引數量提升了近4000倍(1.2億vs5000億),這使得GPT模型的能力顯著提升。現在的成果讓研究人員驚豔,有點像大腦中神經元數量增加後,某種智慧和意識湧現出來。作為參照,人類大腦的神經元突觸連線數量約為100萬億-1000萬億,老鼠約為450億-600億,狗大約是10萬億。

  • GPT:於2018年6月釋出,是OpenAI基於Transformer架構的首個模型,採用生成式和預訓練方法。它在自然語言理解和生成任務上取得了顯著成功。

  • GPT-2:於2019年2月釋出,模型引數從上一代的1.2億增長到了15億。這使得GPT-2在多種NLP任務上取得顯著效能提升,如閱讀理解、機器翻譯和摘要生成等。

  • GPT-3:於2020年6月釋出,第三個版本,擁有超過1750億引數,比第一代提高了1000倍。此時,GPT模型在各種自然語言處理任務上表現已表現出色,並能生成極具說服力的文字。GPT-3的一個重要特點是它能在沒有顯式微調的情況下,透過調整輸入和輸出格式實現零樣本學習(zero-shot learning)和少樣本學習(few-shot learning)。正因如此,GPT具備了從零開始與人進行對話的能力,第一個版本的ChatGPT就是基於GPT-3。

  • GPT-3.5:於2022年11月釋出,是GPT-3的改進版本,模型引數規模達到了2000億。這個版本的GPT使用了強化學習從人類反饋中學習(RLHF),在各種自然語言處理任務上都有所提升,特別是在對話方面,它能生成更自然、更流暢、更有趣的文字。

  • GPT-4:於2023年2月釋出,是目前最先進的自然語言生成模型,擁有超過5000億引數。這個版本的GPT最核心的新增能力是支援多模態輸入和輸出(如影象、音訊、影片等),這是個革命性的變化,相當於經過改造,ChatGPT能「聽見」和「看見」現實世界。

總結一下,GPT模型從第一代到現在的GPT-4,經歷了多次升級,引數規模不斷擴大。這使得GPT模型的能力得到顯著提升,能應對更多複雜的自然語言處理任務,為人們提供更智慧、更自然的互動體驗。

三、ChatGPT的應用場景簡述

事實上,其實任何與「語義理解」和「語言生成」有關的所有事情都能靠ChatGPT得到很大程度的解決:

「語義理解」:比如最簡單的翻譯(需要理解詞語的意思),智慧客服(需要理解客戶的請求),文章總結,會議紀要等等;

「語言生成」:這是指你的結果是需要它幫你生成一段文字或程式碼,這方面它能處理得很好,比如回答問題,撰寫文章,寫一個網頁的程式碼等等。

不過像我們前面的GPT-4有多模態的能力,他還能理解和生成影片、圖片、音訊等,這本質上也是因為這些內容在計算機儲存的時候就是0和1,所以他是能把這些內容解構為類似語言的東西實現對應能力的。OpenAI官網上也提供了一些他們能做什麼的參考,可以看看。

https://platform.openai.com/examples