傑愛得資訊》名詞庫》Transformer模型

Transformer模型於2017年由Google推出

Transformer模型（直譯為「變換器」）是一種採用自注意力機制的深度學習模型，這一機制可以按輸入資料各部分重要性的不同而分配不同的權重。該模型主要用於自然語言處理（NLP）與電腦視覺（CV）領域。

與迴圈神經網路（RNN）一樣，Transformer模型旨在處理自然語言等順序輸入資料，可應用於翻譯、文字摘要等任務。而與RNN不同的是，Transformer模型能夠一次性處理所有輸入資料。注意力機制可以為輸入序列中的任意位置提供上下文。如果輸入資料是自然語言，則Transformer不必像RNN一樣一次只處理一個單詞，這種架構允許更多的平行計算，並以此減少訓練時間。

Transformer模型於2017年由Google大腦的一個團隊推出，現已逐步取代長短期記憶（LSTM）等RNN模型成為了NLP問題的首選模型。

並列化優勢允許其在更大的資料集上進行訓練。這也促成了BERT、GPT等預訓練模型的發展。這些系統使用了維基百科、Common Crawl等大型語料庫進行訓練，並可以針對特定任務進行微調。

下方繼續閱讀

jAD Ads 聯播廣告

曝光6,625/日成本100/月

下文請點廣告解鎖

投放Google多媒體聯播網廣告(點此)arrow_downward，包含轉換代碼安裝

※ 如果看到投資類型廣告，請再三評估風險！

繼續閱讀keyboard_double_arrow_down

基於Transformer模型，2022年11月，OpenAI推出ChatGPT ( Chat Generative Pre-trained Transformer )

Transformer模型後來造就了OpenAI公司的ChatGPT，ChatGPT全稱聊天生成預訓練轉換器（英語：Chat Generative Pre-trained Transformer），是OpenAI開發的人工智慧聊天機器人程式，於2022年11月推出。該程式使用基於GPT-3.5、GPT-4架構的大型語言模型並以強化學習訓練。

ChatGPT目前仍以文字方式互動，而除了可以用人類自然對話方式來互動，還可以用於甚為複雜的語言工作，包括自動生成文字、自動問答、自動摘要等多種任務。如：在自動文字生成方面，ChatGPT可以根據輸入的文字自動生成類似的文字（劇本、歌曲、企劃等），在自動問答方面，ChatGPT可以根據輸入的問題自動生成答案。還有編寫和除錯電腦程式的能力。

在推廣期間，所有人可以免費註冊，並在登入後免費使用ChatGPT與AI機器人對話。

資訊來源

聯播網：吉傳媒, 傑愛得資訊, 吉拉X, 劉俊宏,

傑愛得資訊》 名詞庫》Transformer模型

傑愛得資訊》名詞庫》Transformer模型