%3C!--%20Global%20site%20tag%20(gtag.js)%20-%20Google%20Analytics%20--%3E%0A%3Cscript%20async%20src%3D%22https%3A%2F%2Fwww.googletagmanager.com%2Fgtag%2Fjs%3Fid%3DUA-57187271-1%22%3E%3C%2Fscript%3E%0A%3Cscript%3E%0A%20%20window.dataLayer%20%3D%20window.dataLayer%20%7C%7C%20%5B%5D%3B%0A%20%20function%20gtag()%7BdataLayer.push(arguments)%3B%7D%0A%20%20gtag('js'%2C%20new%20Date())%3B%0A%0A%20%20gtag('config'%2C%20'UA-57187271-1'%2C%20%7B%0A%20%20cookie_flags%3A%20'max-age%3D7200%3Bsecure%3Bsamesite%3Dnone'%0A%7D)%3B%0A%3C%2Fscript%3E
跳到主要內容區塊

關於聊天機器人你不可不知的 5 件事

機器人的普及正加速來臨,尤其在內容重複性高、資訊容易被複製的領域,例如客服應答、抽獎文回覆等場景,導入聊天機器人 (Chatbot) 再適合不過了。然而,企業對於 Chatbot 仍容易產生誤解。

Chatbot 究竟是什麼?

Art editor Img

圖片來源:YOCTOL

許多面向消費者的企業,常有消費者電話打不進去、客服電話接不完的問題,因此期待機器人能增強電話客服的服務量,減低客服人員的負擔。Chatbot 的對話方式,確實包含了文字和語音兩種可能的形式。然而,文字判讀和語音識別,背後所需的技術其實不盡相同。以下比較兩者的異同:

文字判讀和語音識別比較圖

圖片來源:YOCTOL

語音和文字的人工智慧 (Artificial Intelligence, AI),都需要「自然語意理解」(Natural Language Understanding, NLU) 技術。當機器人理解了人類輸入的語句後,便會選擇對應的文案來回應。無論是聊天軟體內的文字機器人,或是會講話的智慧家電,都是相同的原理。

不過,在進入 NLU 判讀之前,語音機器人必須先透過語音辨識技術,識別出重要的波段、將語音轉成文字,才能進行語義判讀,「聽懂」人類的話語。而在聽懂之餘,企業所期待的「機器人會講話」,又另外牽涉到文字轉語音、甚至語音生成技術。

目前市場上對於 IM bot 的開發,都是以文字判讀為主。若企業有牽涉到語音技術的需求,便需要在專案早期另行規劃。

#2 實體 vs. 虛擬:Chatbot 就是站在店鋪門口的機器人?

Art editor Img

圖片來源:YOCTOL

根據科幻電影和新聞媒體的描繪,許多人會想像機器人應該「有頭有臉」、有副金屬打造的結構、能依照指令行動的軀體,例如鴻海和軟銀合作推出的 Pepper、華碩推出的 Zenbo。

然而,機器人未必要有實體構造。
 
以富蘭克林的富國民基金小助手、會即時推播 PTT 爆文的 Poller.AI 為例,兩者都是直接在網路上和使用者對話,沒有實體軀殼。Chatbot 只是個「能聽懂指令的軟體」,未必需要和硬體結合。

#3 Chatbot 就是 AI?

Art editor Img

圖片來源:YOCTOL

搭著人工智慧的熱潮,許多人都將 Chatbot 和 AI 劃上等號,尤其對於 AI 領域中近年相當熱門的機器學習(Machine Learning)技術充滿想像,認為「Chatbot 可以自己舉一反三」。

然而,這裡有二個重要的迷思有待釐清:

1) 許多人會認為,AI 就是「像人類一樣具備學習能力,會舉一反三的電腦」。然而,根據電腦科學界廣義的認定,只要展現出像人的行為模式,就能稱作 AI。換句話說,機器學習只是實現 AI 的一種方式,而實現 AI 的方法有很多,例如「窮舉規則讓電腦展現出很像人類的行為」,也是種打造 AI 的方式。

許多人提到 AI 的時候,心中想的其實是「有機器學習模型的 AI」。而近年相當熱門的深度學習(Deep Learning)、類神經網絡(Neural Network, NN)等技術,則是機器學習領域的分支。

2) Chatbot 未必要包含機器學習的成分;而 Chatbot 遵從指令做事的能力,也未必要憑藉機器學習才能實現。

舉例而言,以入圍奧斯卡多項大獎的電影-敦克爾克大行動為背景的 Dunkirk Movie Teaser Bot 為例,就是透過預先撰寫好的規則腳本,單純透過按鈕和文案,在對話視窗中帶領使用者體驗經典戰役。此機器人僅運用了決策樹,將故事情節化為節點,在使用過程中逐步展開劇情;而遊戲最後的結局評等,亦是基於預寫好的規則,並未導入機器學習技術,讓 Chatbot 發展出更多元的劇情。

那麼,導入機器學習演算法的 Chatbot 有什麼特色呢?簡單來說,有機器學習演算法的 Chatbot,具備舉一反三的能力,而沒有機器學習演算法的 Chatbot,就得把所有規則都寫死,一個指令一個動作。

例如,當我們想讓機器人做出「聽懂『預約看診』這個意圖,進而提供『門診時間表』的圖片給使用者」這個動作時:

【基於規則的機器人】
只要聽到「預約、門診、看診」等關鍵字 -> 就提供門診時間表
情境「我要預約今晚的門診」 -> 『您好,請參考門診時間表 🏥』
「我今晚想過去看病」-> 『抱歉😭,我不明白您的意思...』
「你們星期天有開嗎?」-> 『抱歉😭,我不明白您的意思...』

基於規則的機器人在有限的關鍵字範圍內,能表現得很好。然而,對於同一件事的講法可能有千百種,而我們很難窮舉出所有的講法,輸入到機器人的知識庫裡。因此,基於規則的機器人在對話彈性方面,無法創造出很好的體驗。

而導入機器學習的機器人,則能夠理解不同問法:

【導入機器學習的機器人】
從「預約、門診、看診」中,探索出其他意涵相近的詞彙,例如「看病、掛號、上班時間」等
-> 提供門診時間表
情境「我要預約今晚的門診」 -> 『您好,請參考門診時間表 🏥』
「我今晚想過去看病」-> 『您好,請參考門診時間表 🏥』
「你們星期天有開嗎?」->『您好,請參考門診時間表 🏥』

關於機器學習的導入方式,以及模型的訓練方法,未來將在系列文章深入介紹。

#4 有了學習能力,Chatbot 就會自己變聰明?

Art editor Img

圖片來源:YOCTOL

拜機器學習的熱潮所賜,企業對於「讓電腦從蒐集到的資料中學習,進而做出更精準的判斷」的場景,已經不陌生。因此,企業在導入 Chatbot 時,往往會期待:一、 Chatbot 可以記住答錯的問題,下次便能提供更好的回答,二、Chatbot 可以不斷根據新的商品/行銷活動,產生新的互動文案或圖片。

然而,電腦本身不會無中生有產生一個演算法。Chatbot 的作答準確度確實能透過程式化的方法被改善,也能更新文案和影音互動的內容;然而,人類必須明確告訴電腦「你答錯了」,並告訴電腦正確答案為何,也必須進入 Chatbot 的知識庫中,更新商務資訊,電腦程式才能有所依據地修正自己的互動腳本。告訴電腦「你答錯了」的方式、以及更新商務資訊的方式,各有很多種,系列文章未來將深入介紹我們的解決方案。

簡言之,Chatbot 的自我調校機制,仍然有賴於人類的維護。因此,優拓在機器人建置專案中,會根據專案規模和企業的需求,評估每月維護所需的成本。

#5 Chatbot 應該很會聊天?

Art editor Img

圖片來源:YOCTOL

「聊天」機器人,應該很會聊天嗎?未必如此。閒聊 (small talk) 其實是門博大精深的學問。人類的日常禮節、轉換氣氛的幽默感,都是長年的社會互動經驗所累積下來的。人類長期暴露在各種社會情境下,大腦所累積的應對機制,複雜度是很驚人的,難以在短時間內窮舉、輸入電腦中。
 
若要灌輸機器人「遇到年長的人士要稱讚他們看起來很年輕」等社交禮節,就必須輸入大量的人類閒談資料,讓電腦從中學習,並調校應對進退的文案。然而,一般的商務機器人開發專案,時程為期僅數個月,不建議投入太多時間在閒聊的內容上。對於閒聊話題的常見回應方式,會是預設一些制式的禮貌回應,並盡快將話題引導回商務機器人的專業領域。

小結

聊天機器人的熱潮持續增溫,而相關的討論更是層出不窮,然而,釐清聊天機器人的潛力與限制的文章卻較為少見。本文藉由列舉出企業對於聊天機器人的常見誤解,期待讓有意導入機器人的企業對 Chatbot 有更多認識,以利企業能夠更精準地評估自身對於 Chatbot 的需求,以及專案過程中需要投入的時間和資源。

Estelle Huang

Babysitting chatbots at Yoctol. Obsessed with music and stories.

原文出處優拓資訊 (Yoctol Info Inc.);政府網站營運交流平台授權轉載