•ChatGPT的工作原理是大型語言模型(large language model,簡稱LLM),是AI領域相對較新的訓練模型,約在5年前首次出現,如今已可以撰寫各種文章。
第1步 設定目標
•AI系統須預先設定目標函數,大多數LLM模型的基本目標函數為:給定一個文本序列,猜測接下來的內容。
第2步 收集大量數據
•大量收集訓練數據,ChatGPT等通常從互聯網上搜集數十億個頁面作為數據庫,如博客文章、推文、維基百科和新聞。
第3步 建立神經網絡,組裝「大腦」
•數據被拆分成標記單元輸入模型,可是單詞、短語或單個字符。接下來組裝人工智能的「大腦」:即AI的神經網絡系統。這是一個由相互連接的節點(或「神經元」)組成的複雜網絡,用於處理和存儲信息。
第4步 訓練AI「大腦」
•通過訓練,該AI模型學會分析數據,識別不同模式和關係,學會如何構建有意義的信息。相關訓練耗時幾天甚至幾周,耗費巨大的計算能力。
第5步 微調模型
•一個大型語言模型被訓練出來,需要為特定的工作或領域進行校準,通常由人類進行微調。
第6步 上線啟動
來源:《紐約時報》
领取专属 10元无门槛券
私享最新 技术干货