Analytics

從ChatGPT爆紅 談企業需要什麼樣的人工智能

分享文章:

文章作者:陳宇翔,IBM 傑出工程師、IBM 大中華區金融業首席架構師

最近AI業界最大的新聞無疑是ChatGPT「橫空出世」。市場上有大量的評論文章,有的把它描述成無所不能,大有取代人類職業之勢;也有的表達擔憂,例如某些頂級學術期刊與知名學府已經明確地限制AI作者發表論文和科學研究成果。

出於好奇,筆者也試用了ChatGPT。對於一般的開放型問題,ChatGPT生成的回答文法結構完整,語言風格自然,比起以前的聊天機器人有顯著的進步。內容的準確性和完整性,往往能超過正常交流時大多數人的「第一反應」,更像是經過了一番思考並整理後的結果,條理清晰,具有啟發性。但對於專業型問題,尤其是需要邏輯推理的知識,ChatGPT並沒有像網路文章說的那麼出色,反而經常張冠李戴,或是形式上有模有樣,內容卻不知所云。

為什麼會這樣?我們可以問一問 ChatGPT 它自己:

「ChatGPT是由OpenAI公司開發的一款預訓練語言轉換器,目的是生成人類可讀的文本。它透過讀取大量的文本數據,學習了如何生成與語言相關的內容,並在輸入一段文本時生成一段有關的文本輸出…。」

ChatGPT中的GPT全稱是Generative Pre-trained Transformer -即「生成式預訓練轉換器」。借用名叫#矽谷學霸Jolin的科技教育部落客對GPT模型的解釋:以ChatGPT為代表的「生成性AI」是一項技術突破;之前AI學習大多聚焦於觀測、分類和分析內容,而生成性AI則不限於分析現有數據;它可以生成新內容,可以根據需要,生成新的代碼、詩歌、文章和藝術品。ChatGPT是專注於文本內容的生成性AI。所謂「預訓練」是指該轉換器已經在某些有限的數據集上進行了訓練;事實上,ChatGPT已經學習了2021年6月以前人類編寫和發布在互聯網上的海量資料,而且是通過「監督學習」和「人類反饋強化學習」這兩種技術進行的學習。

Transformer是一個底層的AI機器學習的算法架構,是一種深度神經網路。從GPT-1到今天的GPT-3.5都是採用Transformer架構,而GPT模型的進化有賴於底層硬件超級運算力的效率提升,以支持AI對更多、更大數據集的訓練和學習 。

也就是說,ChatGPT是通過海量(約45TB )語料訓練而掌握了語法和語義結構的成熟的大型語言模型(Large Language Model, LLM),其特色是生成文本的能力很強;產生的文字風格和內容與之前的輸入很像,也就是人類語言。由於訓練語料涉獵的層面廣泛,所以ChatGPT對各行各業的資料都有涉獵,總能略知一二,有時甚至回答得頭頭是道。對某些專業領域例如寫程式,甚至可以產生準確的代碼並直接運行。然而,你若仔細觀察,這些代碼往往都是解決特定的小任務,代碼風格似曾相識;若要完成一個創新的算法,或者複雜問題的編程,ChatGPT就無能為力了。

總體而言,這類通過學習語料來生成文本的AI模型,都是在「學習過去」,其目標是模仿過去,生成幾可亂真的作品,並不是真正意義下的「創造未來」;ChatGPT也不例外,作為助手,它對思考的廣度有幫助,但是對思考的深度卻不盡然。

從聊天對象到業務助手

ChatGPT 讓我們看到了大型語言模型的未來。在企業應用中,為了創造高業務價值,這類對話形式的應用(ChatBot,聊天機器人)更多是用於對外的「客戶服務」或對內擔任「業務助手」。這些應用場景對此類模型提出更高的要求——

第一,準確性和專業性

企業往往要求回答準確且專業;如果對答案沒有把握,回答「不知道」也好過生成一大段冗長但無用的文字。

ChatGPT是一種「開放領域系統」(Open-domain system),類似的還有Google的Bard,它們都需要海量的資料輸入和長時間的訓練,以應付所有領域的對話;回答內容相關度高,對答如流,語法自然。

而企業級的ChatBot是一種「封閉領域系統」(Close-domain system);企業往往不需要一個乖巧的「萬事通」,而是需要一位在專業領域裡可靠的「知識助手」。它的訓練語料是有限的,包含企業內部文檔和資料、專業領域知識庫、該領域在外部的相關文章等;大量的資料都是不公開的。 ChatBot能回答的問題也限定在專業領域的場景語境中,不必面面俱到,但求簡潔、精準、專業。

第二,主動式對話

遇到模棱兩可的提問時,企業Chatbot往往要求透過主動引導式對話、甚至以反問的方法迅速澄清提問者的需求,然後再給出明確的答案。這一點目前ChatGPT尚未做到;當提出的問題模糊時,ChatGPT的回答也模糊;提問者發現後換一種問法,或者在對話中縮小範圍,便可逐步得到想要的結果。在整個過程中,ChatGPT每次都是被動回答。

第三,後台整合能力

作為企業對話的窗口,ChatBot在提供服務時需要和企業大規模的後台系統連結和整合。例如在識別提問者需求後,可以從資料庫或大數據平台上自動收集相關數據,進行分析和推理,得到客戶所需的明確答案;或者啟動一條指令或一個後台流程,幫助客戶完成相關操作。

IBM Watson企業級AI應用

OpenAI從2018年以來長期堅持研發大型語言模型,透過不斷迭代,從最初的GPT-1到目前的GPT-3,2023年將發行GPT-4。目前在開源社群找到的GPT-3模型,為企業開展此類研究提供了範本。

ChatGPT對企業的吸引力是無庸置疑的,多數企業都有意願擁有一個自己的ChatGPT。然而,當前ChatGPT採用最新的GPT-3.5模型,含有千億級參數,一次訓練就要花費數百萬美元,大多數企業都不具備如此大的運算力。如果為了獲得對話模型,把企業內部數據都傳到網路上,利用公有雲環境訓練,也會有資訊安全的顧慮。所以,企業主導訓練一個定製版的ChatGPT,無論從技術、成本或是符規來考量,困難度都相當高。

IBM Watson是IBM企業級的人工智能,經過十多年的發展,從研究到實驗,如今已經發展成為一套可以在Red Hat OpenShift平台上自由運行的AI能力,以產品化的型態提供給客戶,幫助企業整合和分析混合IT環境中、分散而複雜的企業數據,以便實現由數據驅動的預測型決策、智能自動化、和基於企業內外即時數據和洞察的安全策略與回應。

IBM Watson如今已經應用在全球四萬多個企業客戶的業務場景裡,為具備各類型AI技能的用戶提供先進的AI能力,無論是想利用AI獲得工作效率的專業人士(例如人力資源、財務、網路安全管理人員等),或是具備一定AI技能並且正在大規模使用AI的資料科學家、IT人員等。

IBM Watson提供了許多不同的工具和服務,用於解決多種問題。它涵蓋了語言處理、解釋、回答和生成文本等多種功能,以幫助客戶解決商業問題。同時它也提供了語音識別、圖像識別等功能,使其成為一個非常強大和全面的人工智能平台。

長期以來,IBM Watson 提供企業級AI應用,特別為企業量身定做「業務助手」類的對話式應用。基本上,IBM Watson 有語音文字轉換、意圖識別、對話流設計、文本分析、知識整理、情感分析等功能,使得Watson可以在通用的語言模型上疊加專業領域知識,並有意識地設計和引導對話方向。

IBM Watson 透過後台的機器學習、自然語言處理、文本生成、語音識別與合成、對話系統、知識圖譜技術,可以分解文本結構,精準定位觀點、事實、論據、邏輯關係等。2018年,採用 IBM Watson 技術的IBM人工智能辯手(Project Debater) 就曾以它的機智、幽默和高情商而驚艷四座;它可以針對任何一個預設話題,例如「政府應該為人民提供基本收入」,臨場選擇正方或反方,與人類辯論冠軍選手進行對辯。

今日的 ChatGPT也可以達到這樣的效果!我們必須承認其通用語言模型和文本生成技術所呈現的體驗,甚至可以超過IBM Watson;其開放的使用者介面更是讓社會大眾都能夠親自擁有”Wow”的感受。然而IBM Watson的專業性、可設計性與整合性,則更適合企業級的業務定位。IBM 把這種普適性的大型基礎模型稱為基礎模型(Foundation model),它利用遷移學習(transfer learning),經過少量的專業訓練,就能進入一個知識領域,並且得到新的啟發。這一點與人類的學習過程非常相似,有豐富的應用前景,也是IBM正在研究的重點之一。

共創更高AI商業價值

我設想:企業已有的IBM Watson對話模型,也可以運用ChatGPT加以優化,互相「協同合作」;當出現專業領域的封閉式問題,用原有 IBM Watson 模型回答;當發現開放式問題,就用ChatGPT回答。也可以設計為競爭模式—一次生成多個答案,由人類當裁判,讓 IBM Watson 與ChatGPT互相學習,共同進步。企業級的應用若能結合ChatGPT與 IBM Watson 各司所長,不失為快速、高效地應用AI技術、提升使用者體驗、創造更高商業價值的最佳選擇。

參考資料:
[1] OpenAI公司在GitHub上開源的GPT-3模型 https://github.com/openai/gpt-3
[2] IBM致力於基礎模型研究 https://research.ibm.com/blog/what-are-foundation-models
https://research.ibm.com/blog/molecular-transformer-discovery

 

IBM 傑出工程師、IBM 大中華區金融業首席架構師

More Analytics stories
2022-08-04

IBM 純網路保險四部曲:(四)純網路保險-一箭雙鵰

鯰魚效應發酵 作者:IBM Consulting 混合雲服務解決方案顧問經理 王志明 政府按照純網路銀行開放模 […]

繼續閱讀

2022-07-06

IBM 純網路保險四部曲:(三)純網路保險-百鍊成鋼

純網保經營挑戰 作者:IBM Consulting 混合雲服務解決方案顧問經理 王志明 俗話說殺頭生意有人做, […]

繼續閱讀

2022-06-20

台灣高鐵採用 IBM 混合雲平台 建置新世代訂位票務服務系統

【2022年6月20日,台北訊】近期新冠肺炎疫情嚴峻,為優化非接觸式服務,並追求更高的運輸效率,台灣高鐵公司( […]

繼續閱讀