生成式人工智能(GenAI)已深入大街小巷,從遙不可及的實驗室走入尋常百姓家。常見的DeepSeek、ChatGPT、Gemini等聊天機器人已成為我們的朋友或辦公助手,許多年輕而富有想像力的用戶甚至為AI創作了擬人化形象,或分析他們的MBTI(職業人格測試)。
的確,不同AI機器人似乎有不同的聊天風格,即我們常說的「人設」(角色設定)。用戶們的這種創作本身非常富有人文溫度,不過需要警惕的是,AI處理文字並非通過思考或理解,而是依賴複雜的數學計算和統計模式匹配,我們所能看到的文字生成動畫,以及「思考中」的提示,其實都是UI(用戶互動界面)的一部分。
AI的輸入—處理—輸出過程可拆解如下:
首先,用戶輸入的文字首先被分解成更小的單元(單詞或字符),這些單元被稱為標記。
更重要的是,每個標記會被轉換成一個高維度的數字向量(詞嵌入)。這個向量不是隨機的,而是在海量文本訓練過程中學習到的,語義相似的詞(如「貓」和「狗」)其向量在數學空間中的距離會更接近。
這些代表標記的數字向量被送入一個名為 Transformer 的核心神經網絡架構。模型的核心是自注意力機制。
其後,這個機制通過複雜的矩陣運算(主要是向量點積和加權求和),讓模型能夠計算序列中每一個標記與其他所有標記之間的關聯程度(注意力權重)。這使模型能動態地關注輸入文本中不同位置的重要信息,理解上下文關係,例如某個代詞指代前文的某個名詞。
這些計算在模型的多層結構中反覆進行。每一層接收前一層處理後的向量表示,並進一步提煉和整合信息。低層可能捕捉基礎語法和局部詞義,高層則整合更複雜的語義和上下文關係。
所有計算都是確定性的數學函數作用在輸入向量和模型內部存儲的海量參數上。這些參數在訓練階段通過優化算法調整,以最小化預測誤差。
最終,當模型在接收到你的輸入後,它從代表「開始生成」的特殊標記起始,基於當前已有的所有標記序列(包括當前輸入及歷史會話),運用其內部參數和數學規則,計算出一個覆蓋所有可能標記的概率分布。這個分布預測了下一個最可能出現的標記是什麼。
模型並非總是選擇概率最高的那個標記。它會採用如採樣(按概率隨機選)或集束搜索(保留多個候選序列)等策略,結合溫度參數(控制隨機性高低)來決定最終選哪個標記。這引入了輸出的多樣性和變化。
此外,選中的新標記會被加入到序列中,成為新的輸入上下文的一部分。模型再次計算下一個標記的概率分布,並重複「預測—選擇—添加」的過程。
這個過程持續進行,直到模型生成一個代表「結束」的特殊標記,或者達到預設的最大生成長度。
「深度思考」並非計算過程本身
在生成回覆過程中,你有時會看到「思考中……」或「正在輸入……」的動畫提示。這些顯示的文字或動畫本身並不是AI在內部進行思考的反映。它們完全是用戶界面(UI)的設計元素。它們的目的是在後台模型進行實際計算時,向用戶提供視覺反饋,減少等待的焦慮感,模擬人類對話的節奏。
本質上,它們和你看到的最終回覆文字一樣,都是系統預先設定好的輸出內容的一部分,而非計算過程本身。計算過程是高速的數學運算,沒有主觀體驗。(二之一)
●文鯉