

現在很多人用 AI 聊天機器人來查資料、問問題,像是ChatGPT這類大型語言模型(Large Language Model,LLM),已經變成很常見的工具。不管是想了解健康資訊、找資料、還是幫忙整理報告,它都能快速給出看起來很專業的答案,大大提升我們找資料的效率。不過問題來了,AI講的內容,真的都對嗎?因為AI回答的範圍太廣,有時候會講錯或是「看起來很合理但其實是假的資訊」。為了改善這問題,有些系統會把AI接上外部資料庫(Retrieval-Augmented Generation,RAG),讓它參考更多資料來源,幫助它回答得更準確。但即使這樣,AI還是有可能理解錯內容、或是把資料搞混。因此,現在研究人員和開發者正努力找出一種更通用、有效的方式,幫AI自動檢查自己說的話對不對,這已經成為發展AI的重要方向。

在這個網友三秒鐘換一個話題的時代,品牌、公關與決策者最常遇到的挑戰就是:到底該相信哪一則消息?掌握輿情變得比以往更重要,但也更困難。然而,隨著 AI 技術的突破,尤其是大型語言模型(Large Language Model, LLM)與檢索增強生成(Retrieval Augmented Generation, RAG)的應用,讓我們終於有機會將看似雜亂無章的網路資訊,轉化為具體、清晰、可用的決策依據。

生成式大型語言模型(large language model,簡稱LLM)的強大能力,已經廣泛應用於知識問答、摘要生成、語意分析等相關服務,但對於生成內容的正確性,仍備受關注。雖然LLM是基於海量數據訓練而成,並能夠生成流暢且結構完善的文字內容,但這並不表示內容完全可靠。因此,在設計LLM的應用服務時,也必需設計相關的驗證機制,也就是說讓 AI 學會「反省」,幫自己檢查答案的正確性,才能減少這些似是而非的生成內容。

ChatGPT問世至今已兩年,「生成式AI」成為產業顯學。根據彭博行業研究最新報告表示,生成式AI軟體的市場規模預計會從去年的50億美元,到2032年激增至3,180億美元,平均每年成長率高達59%,總成長幅度超過6,260%。生成式AI的技術正從「快思考」向「慢思考」轉型,不再只是生成內容,而是逐步提升推理能力,進一步進行解釋、規劃和執行任務。為了提升大型語言模型(Large Language Model,LLM)的生成品質,「提示工程(Prompt Engineering)」成為關鍵技術。本文將簡單介紹三種提示技術—思維鏈、思維樹和思維圖,說明它們如何幫助生成式AI變得更聰明。

近年來,大型語言模型(英語:Large Language Model,LLM)的技術突飛猛進,使得各種以「AI」為主軸的服務應運而生,開啟人工智慧新篇章,也反應出大型語言模型的可靠性,為產業和民眾帶來前所未有的創造力和智慧。除了使用OpenAI的ChatGPT、Google的Gemini和Microsoft 的Copilot等第三方服務外,現在也可以在私有環境中運行 Mamba、Meta的LLaMA 和 微軟的Phi-3 等語言模型。相較於這些公開的第三方服務,使用自己運行的大型語言模型,不僅不必將資訊透過網路傳輸到公開的服務端,大大降低數據外流的風險,還能根據特定需求進行微調,進而強化模型在專業領域的生成品質。

近幾年,許多台灣品牌都已開始使用社群聆聽 (Social Listening)工具,在進行網路輿情分析時,僅憑簡單的關鍵字判讀常常會帶來大量不相關的訊息,例如,當使用者搜索「iPhone」相關內容時,搜索結果往往充斥著各類抽獎活動,這顯然與用戶實際需求不符。因此,為了強化搜索效率與精確度,系統運用AI人工智慧技術,對文本進行深入分析和分類,但是,過去的分類技術需要花費大量時間進行資料註記和模型訓練,才能實現更細致或準確的分類。不過,現在隨著AI技術的進步與GPT的加持,文本分類已經能夠迅速反應市場需求,讓使用者可以透過類別篩選,快速地找出更精準的輿情資訊。就彷彿進入到GenAI的魔法世界,透過分類帽能快速將學生分類到相對應且合適的學院。

網路社群的發展,改變了現代人的閱讀及生活習慣,傳統的新聞媒播方式已逐漸式微,Facebook、Instagram、YouTube、X、TikTok、Threads等社群平台逐漸發展成為一種新興的媒體溝通工具。平均每天約多出超過數百萬筆網路輿情資料,其擴散程度既深又廣,一般直接從Google上是很不容易查詢到特定人物、議題、時間、地點及產品的所有評論,甚至針對聲量做頻道統計、好感度或等深度分析,因此輿情分析系統就成為強而有力的助手。究竟如何從巨量的網路輿情中進行分析與洞察呢?除了自動化摘要技術(Automatic Summarization)之外,「主題模型(Topic Modeling)」也是常見的重要技術之一。以下將針對主題模型做簡單的說明:

人類語言博大精深,科學家一直嘗試著讓電腦變得和人類一樣,具有感知、學習與協助決策的能力。自然語言處理(Natural Language Processing,NLP)成為近年來熱門且挑戰性十足的研究領域。但是,人類語言的博大精深,有辦法教會電腦理解嗎?尤其一詞多義的雙關語是運用詞的多義和同音條件,有意使語句具有雙重意義,言在此而意在彼的修辭方式。例如「這樣吃牛肉麵的話會很難吃」,在這個句子中的「難吃」可解釋為方法不對「很困難」進食,或指味道不好。這些不僅讓人類說話時要花上心思理解的修辭方式,以現在電腦處理的方式有可能最後產生的語言模型,並沒有邏輯、因果與知識。