前沿:

開頭必須來一句,我相信語音一定是未來,我非常確認

這篇 HMI 的語言探索以介紹語音交互內(nèi)容為基礎(chǔ),結(jié)合我的實際工作項目經(jīng)驗,輸出總結(jié)關(guān)于語音設(shè)計的內(nèi)容,最后結(jié)合案例,在對話設(shè)計中會進行深度的探索,并提出個人的想法和思路,因為有的時候深度去思考覺得我們項目還可以有很多優(yōu)化的點。

進入我們今天的正題。

在說語音交互之前,先給大家講一下題外話,關(guān)于人機交互(Human Computer Interaction)簡稱 HCI,可能日后我想去攻讀這個碩士學(xué)位,簡單來說就是指人與計算機之間通過使用某種對話語言,以一定的交互方式,為完成確定任務(wù)的人與計算機之間的信息交換過程。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

語音助手最初的載體是手機 APP,通過與用戶之間的對話方式,能夠幫助用戶來解決問題的,隨著我們現(xiàn)在人工智能的研發(fā)技術(shù)不斷發(fā)展,包括讓機器學(xué)習(xí),語音識別、圖像識別、自然語言處理、智能搜索等一系列。語音交互運用的很普遍了,不僅僅只是智能手機,現(xiàn)在涉及到的領(lǐng)域是越來越多了,如智能家居、汽車、可穿戴設(shè)備、就連商場普遍也有機器人語音對話。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

HMI 語音介紹

我這邊就不打算講語音的發(fā)展歷史了,不然又是水了一大堆內(nèi)容,我可是一個講干貨的小作家呢,如果我的小粉絲們需要的話,就私信我,我會在微信公眾號更文。

語言是傳遞信息重要方式,對于我們用戶來說,語音交互也是學(xué)習(xí)成本相對較低、容易掌握的,語音交互設(shè)計簡稱為 → VUI。

新能源汽車不斷的發(fā)展,智能車載系統(tǒng)也是我們最看重的。隨著語音交互的的普及,語音識別開始走入人們生活,憑借其實用性和準(zhǔn)確性得到了用戶的認可,因此在發(fā)展的過程中摒棄了傳統(tǒng)的、繁雜的手動操作,提高安全駕駛屬性和更高效的處理問題的能力,但是,在現(xiàn)階段的新能源汽車發(fā)展過程中還不能完全替換掉手動操作。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

現(xiàn)在為什么用戶在駕駛車的過程中,還是不會常用到語音交互,首先提到的就是用戶習(xí)慣,根據(jù)數(shù)據(jù)調(diào)查,在使用語音交互的人群中,年輕人占了主力軍,其余年齡段的人由于常年駕駛都是通過硬按鍵來操控車內(nèi)空調(diào)、電話、音樂、電臺、內(nèi)置導(dǎo)航。其實就算是蘋果手機中的 siri 都很少用到, 在使用初期因為技術(shù)的不成熟,再加上冰冷的對話方式使得用戶不對這個買單,像我現(xiàn)在生活中,用到的 siri 頻率也會很少,最多就是定一個鬧鐘,app 實在找不到就會使用到,還有無聊的時候和他進行無聊的對話,嗯就這樣子。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

國內(nèi)做語音頭部公司有我們熟悉的科大訊飛,還有和多家車企合作的思必馳、云知聲,對內(nèi)服務(wù)的百度,搜狗,騰訊,阿里這些大咖都有自己的語音技術(shù)。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

再講一下語音的基礎(chǔ)原理內(nèi)容,這一塊比較難懂一點,首先你要說出你需要解決的需求、要處理什么事情,通過車載系統(tǒng)設(shè)備收到指令的語音 → 自動語音識別 (ASR) → 將指令轉(zhuǎn)化為文本 → 自然語言處理 (NLP) → 了解用戶需要解決什么問題 → 通過Skill (普及一下知識:Skill 是一種程序的語言,有notepad++,UltraEdit等,好了不啰嗦了) → 將處理好的結(jié)果處理成回復(fù)文本 → 最后再通過TTS 播報形式 → 形成回復(fù)音頻 → 通過車載系統(tǒng)回復(fù)給用戶解決結(jié)果,聽起來是不是有點復(fù)雜了,我相信我是全網(wǎng)說的最細的了。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

如何去定義一個產(chǎn)品的語音的好壞?我覺得吧,能夠讓用戶對于這個語音系統(tǒng)的滿意度達到一個高標(biāo)準(zhǔn),首先能夠讓系統(tǒng)能夠聽懂你所說的內(nèi)容,并且給出相對應(yīng)的解決方案,語音系統(tǒng)運用的簡而易用即可,如何做到以上的要求,我會在下面對話設(shè)計中會著重講解深挖的。

車載語音交互(VUI)基本原則

車載場景下的語音交互核心基本原則有三點:

1. 首先是安全

駕駛過程中,司機的眼睛、耳朵和手占據(jù)了大部分多任務(wù)操作,如果一些功能還需要通過眼睛和手來操作的話,會降低安全駕駛的系數(shù),所以車載語音交互更有助于輔佐司機安全駕駛,減少注意力的分散。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

2. 其次是便利

語音交互設(shè)計之初,一定要考慮便利、快捷,盡量的減少每一個任務(wù)的對話次數(shù)、快速響應(yīng)、將對話流程簡單化,從而打破 VUI 對于用戶的一個心理障礙(便利這塊內(nèi)容我會在后面對話設(shè)計中著重講解)。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

3. 最后是愉悅

為什么要談到愉悅,因為市場上最初的語音對話交談,都是冷冰冰的,幾乎沒有情感可談,像極了和機器人對話,并且有的時候無法處理任務(wù)就會說,超出能力范圍,這是一個很不好的用戶體驗?,F(xiàn)在市場上可以看到,導(dǎo)航軟件也有語音包可以選擇,這也是增加了情感化設(shè)計,這是其中的一個點。還有一個小點就是自然的對話交流,很流暢的完成用戶提出的每一項任務(wù),盡可能的規(guī)避對話中的錯誤,讓整體的對話過程達到一個愉悅的感覺。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

用戶語音的目的

用戶在語音交互的時候,絕大多數(shù)都是帶有明確指示任務(wù)指令的,也有可能是閑聊狀態(tài)。

1. 任務(wù)狀態(tài)下:

任務(wù)式對話中,用戶需要盡快的得到想要反饋和解決方案,并且快速的完成,此類任務(wù)的反饋要求還需要清晰、簡單明了。

2. 閑聊狀態(tài)下:

我們經(jīng)常也會問 Siri 一些無聊的問題,比如:“siri 給我來一段 Rap” 通常這類的任務(wù)帶有的目的性不是很強,但是對于趣味性要求會高。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

市場現(xiàn)狀(VUI+GUI)

語音是最舒服的交互形式,但是他不能完全取代 GUI,相互協(xié)作才是更佳的方案,所以現(xiàn)在市場上的車載系統(tǒng)大多數(shù)都是以語音(VUI)和圖形用戶界面(GUI)相組合的,也有少部分車加入其他交互方式譬如手勢交互。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

語音與圖形的交互是交叉處理,從而形成了多模,多模態(tài)在我第二篇文章也有講到,第一次看我文章的同學(xué)們可以回顧一下,用戶在對車載系統(tǒng)發(fā)送一個指令的同時,設(shè)備會有多種的反饋方式,首先你可以聽到系統(tǒng)虛擬形象給你做出回答,其次你看到圖形界面的變化,舉一個例子,你說:“我要聽周杰倫的七里香”系統(tǒng)就會處理講頁面跳轉(zhuǎn)到音樂界面,并且播放周杰倫的七里香,如果聲音小了,你可以說:“聲音大一點”

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

大家是不是發(fā)現(xiàn)一個問題呀?我在前面說系統(tǒng)首先會做出回答,然后界面才會發(fā)生變化,但是實際情況,系統(tǒng)語音形象沒有做出任何多余的回答,而是直接聽取到用戶的需求,直接反饋出結(jié)果,播放了周杰倫的 #七里香#,這就是我準(zhǔn)備在下面會重點講到的“對話設(shè)計”

在說對話設(shè)計之前,我們先了解一下 VUI 設(shè)計師,想必大家頭一次聽說,還有語音(VUI)設(shè)計師嘛,國內(nèi)不太注重培養(yǎng) VUI 設(shè)計師,大家可以去招聘平臺搜索一下語音交互設(shè)計師,很少有公司專門針對這個職位去招聘的,就算有,也是招聘算法等研發(fā)崗的職位,VUI 設(shè)計師的工作任務(wù)一般都是公司的產(chǎn)品經(jīng)理或者交互設(shè)計師代勞了,這會肯定就有產(chǎn)品經(jīng)理或者交互設(shè)計師想出來吐槽了,哈哈哈

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

語音交互方式給用戶聽和說兩個動作,相信大家也有聽過 7±2 法則,因此在聽到的信息設(shè)計發(fā)面需要考量,因為用戶聽到一遍內(nèi)容之后就消失了,除非這款車機語音系統(tǒng),有再次復(fù)述上一段話的功能,不然在語音設(shè)計的時候,千萬不要讓用戶產(chǎn)生的認知負荷,更不要挑戰(zhàn)用戶的短時間的記憶力,最強大腦除外,我們大多數(shù)人可不是什么最強大腦是不是。再次強調(diào)一下,就算擁有復(fù)述這個功能,也要注意設(shè)計的語音內(nèi)容,該功能點只是加分項而已,不能打破底線,將語音設(shè)計的原則拋之腦后。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

VUI & GUI 的優(yōu)缺點

再分析一下圖形設(shè)計(GUI)和語音設(shè)計(VUI)之間的優(yōu)缺點,那我們先從優(yōu)點開始說起。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

(1)前面我們有提到 VUI 只需要聽 and 說,而 GUI 則需要觸控屏幕內(nèi)容,在效率和安全方面沒有 VUI 好,觸控操作比語音操作要相對會慢,語音交互方式中駕駛者無需離開方向盤。

(2)在對于整套車機系統(tǒng)而言,GUI 學(xué)習(xí)的成本遠高于 VUI,因為 VUI 只要會交流即可,無須像 GUI 一樣學(xué)習(xí)觸控交互手勢、在哪里點擊等一系列問題。

(3)還有一點,圖形設(shè)計是一種已經(jīng)預(yù)設(shè)好了操作路徑和交互方式,頁面之間存在這層級交互的基本關(guān)系,用戶需要根據(jù)指定的操作進行,而 VUI 則突破了 GUI 的限制,交互更快捷了,舉個例子:“導(dǎo)航去虹橋機場”,VUI 則一步到位,而 GUI 首先需要找到導(dǎo)航應(yīng)用的入口,然后再點擊搜索輸入框,輸入#虹橋機場,確認完畢之后,再點擊導(dǎo)航,我的天吶我寫的都很煩了,說真的還不如語音一步到位呢。

說完優(yōu)點后,我們在反思一下 VUI 還有哪些沒有 GUI 做的好的點.

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

(1)語音交互涉及到 3 塊內(nèi)容,語音識別,識別用戶所說的內(nèi)容,其次語言理解,這邊會關(guān)乎到方言理解的問題,畢竟我國語言博大精深,難以參透哈哈哈,最后是語音的合成,這三塊內(nèi)容如果有一塊出了問題,最后反饋的結(jié)果可能并不是用戶想要的答案。而圖形設(shè)計有這統(tǒng)一的執(zhí)行操作指令,不會出現(xiàn)什么 bug 問題,如果有,那肯定就是這款車機在測試的時候測試人員遺漏的問題,可以投訴。

(2)整套車載的 GUI 設(shè)計都會有一套嚴(yán)謹?shù)牟僮鬟壿?,有明確的信息分布和頁面的層級關(guān)系,但是 VUI 的功能不可見(除非你看那個使用手冊,哈哈哈哈哈)所有的場景 VUI 都需要去探索,在引導(dǎo)性方面會弱很多,所以在買車的時候抓住銷售員使勁的問哈,畢竟你花了一大筆錢來買車了,在試駕的過程中也要多去詢問,就先點到這里了。

(3)GUI 是可以全場景交互,不限制于任何場景,而 VUI 則會受到的場景因素較大,有較多場景中不適用語音交互,最直接的就是設(shè)置中的內(nèi)容。

(4)語音設(shè)計對于用戶的一個記憶力是一個考驗,如果一個很長的 TTS 反饋,用戶不知道哪里才是自己所需要的信息,因此在做 VUI 設(shè)計的時候盡量簡短高效的句子,而 GUI 信息都會呈現(xiàn)在頁面中,所以這個點要相對優(yōu)勝于 VUI 了。

總結(jié)一下

以自然交互為主的,聲音,顯然是最自然的交互形式,但不能完全取代圖形 GUI,而是更好的協(xié)作,盡量減少界面的形式設(shè)計,加強情感化的交互形式體驗,將智能化更好的融入到車載系統(tǒng)中去,讓每一位用戶能夠更好,更便捷,更安全的駕駛著汽車,是我們?nèi)w設(shè)計師的初衷。嗯,感慨了一下。

想用一個成語總結(jié)一下:相輔相成,就是這個意思

語音設(shè)計需要考慮幾個要點

1. 一定要想好從哪里開始,到哪里結(jié)束

我們首先假設(shè)一個場景,調(diào)節(jié)空調(diào)溫度的語音設(shè)計,那 VUI 設(shè)計師需要將這個場景的對話要貫穿該流程中去,那接下去要考慮這段對話可能出現(xiàn)的任何狀況,以及相對應(yīng)的解決反饋內(nèi)容,再第二點設(shè)計 VUI 語法中,我給大家演示一下空調(diào)全方案案例。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

2. 設(shè)計 VUI 語法

語法就是用戶輸入給機器的指令,VUI 的設(shè)計師需要了解對話設(shè)計的意圖,盡量要考慮用戶可能表達的所有方式,將最常用的表達方式提取出來,作為指令的模版,當(dāng)然越多越好,這樣給用戶體驗帶來的感受會更好,能夠解決用戶的問題概率也會提高,別到時候語音助手反饋:“已經(jīng)超出我能力范疇 or 您換個說法試試”,我一聽到這些就炸毛了,后面就不可能再去使用它了,因此 VUI 設(shè)計師一定要多考慮一下指令。語法我會在我工作實際案例有特別詳細的講解(在實際案例篇幅 - 使用語音場景分析里面),這個特別重要,大家要細細的品。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

3. 空調(diào)案列分享:

用戶一開始的輸入指令可能有 “打開制冷模式”、“打開加熱模式”這些都會有點官方定義的語法感覺會很正式。

下面再延展一下用戶輕松的說辭 “我有點熱了幫我開一下空調(diào)”、“今天太冷了,車溫度好低啊” 其實用戶的說法有很多,但是空調(diào)的模式就這么幾種,所以需要抓住關(guān)鍵詞 #熱、#冷、#高、#低 ...,什么意思呢?因為這些關(guān)鍵詞是起到?jīng)Q定性因素的內(nèi)容,其他的修飾詞語可能會千變?nèi)f化,所以語音助手一旦檢索到該詞匯,就可以做出判斷,到底是制冷、還是制熱、還是通風(fēng)等功能。先簡單就介紹這一個,后面還有很多案列,大家好好看奧。

4. 如何設(shè)計好回答用戶的問題

在語音基礎(chǔ)介紹中也有提到過 TTS,他是語音交互中最主要的回答方式,就是將 VUI 設(shè)計者撰寫好的對話設(shè)計腳本,通過 TTS 轉(zhuǎn)化為語音去播報?;卮鹉軌蚪o用戶帶來最直接的感受,回復(fù)是好是壞,會直接影響到這款語音產(chǎn)品的體驗,想要設(shè)計好我想談兩個大方向,設(shè)計腳本盡量簡潔明了,全局系統(tǒng)語言特點保持統(tǒng)一,后續(xù)有案列可以敘述講解的。

國內(nèi)外語音設(shè)計差異點

國內(nèi)的語音設(shè)計和國外也會存在差異點的,首先是地方語言的差異,國內(nèi)語言多達 80 種以上,汽車智能語音在方言這一塊相對堪憂,能夠支持的方言相對較少,這也成為了中文語音識別的一個難題。

在設(shè)計語音之初我們就得定義好,需要支持哪些方言,比如粵語、河南話、四川話等,現(xiàn)在的車載版本微信可以支持 20 多種方言,但是整體的車機系統(tǒng)可能難以做到這一點,這塊內(nèi)容是需要攻克的一個壁壘,據(jù)我查看國外報道,關(guān)于方言解決方案,寶馬、三星和松下三家公司與語音識別公司 Nuance 合作開發(fā)新智能輔助技術(shù),這項技術(shù)使得汽車語音系統(tǒng)在處理特定的方言時,可以更加容易。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

還有一點就是中西方語言文化差異,那就舉一個例子,單從一個社會禮儀就可以展現(xiàn)出兩者之間的差距,國人路過遇見熟人總愛噓寒問暖 “吃飯了嗎?”、“到哪兒去”、“最近怎們樣呀?”等,在我們看來,這是一種有禮貌的打招呼用語,但你要跟西方人這樣打招呼 “Have you had your meal?”、“Where areyou going? ”,他們則會認為,你想請他吃飯,或者干涉其私事,會引起誤解,而西方人見面通常打招呼 “Hello”、“How do you do! ”、“Nice day, isn't it? ”

實際案列講解篇幅

1. 語音喚醒設(shè)計

車載語音喚醒分為免喚醒和需要喚醒,免喚醒的定義就是無需說出喚醒關(guān)鍵詞或者其他任何操作,就直接可以進行與語音助手交談并處理任務(wù)。如需要喚醒的話,觸發(fā)動作可分為點擊、按壓、語音等,目前市場上主流的車機喚醒方式有三種:

實體按鈕,好處就是能夠給到用戶觸覺上的反饋,用戶感知性強

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

虛擬按鈕:此類的按鈕一般都會在中控屏幕上面,喚醒的方式是點擊

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

語音喚醒:在駕駛場景中雙手被占用,不能遠距離的操作中控屏幕,最佳的交互操作方式就是語音喚醒

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

語音助手形象

在語音助手形象設(shè)計方面,會分為兩種,一種是卡通化語音助手形象,而另外一種是抽象化語音助手,下面用實際案例展示一下,卡通形象我們就拿未來汽車的 NOMI,抽象化 Google 的 Android Auto 語音形象

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

基于工業(yè)設(shè)計 2021 年 01 期的調(diào)查數(shù)據(jù)分析來看,卡通化的語音形象在親和力上有很大的優(yōu)勢,能夠被用戶快速的接受,但是辨識度上可能存在同質(zhì)化嚴(yán)重問題,所以在效果表現(xiàn)力上面有欠缺,也較難表達車企的品牌理念。抽象化的語音形象則通過造型的多變和動效豐富,從而在設(shè)計感和效果上相對突出,在傳達性上也不滿意,用戶不容易知道當(dāng)前語音是處在一個什么狀態(tài)下,在親和力上遠也不如卡通化形象。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

使用語音場景分析(重點)

關(guān)于車內(nèi)可以延展很多應(yīng)用的場景,要知道用戶在駕駛過程中需要完成什么樣的任務(wù),接下來我們就圍繞這幾個核心的功能點 → 多媒體(娛樂)、車輛控制、導(dǎo)航、電話,順帶將每個模塊語音基礎(chǔ)話術(shù)指令帶過一下外加TTS反饋,也是讓初學(xué)者熟悉一下命令,這塊內(nèi)容很重要奧,都是我在實際項目工作中總結(jié)出來的,大家要上點心好好看,答應(yīng)我好嘛

1. 多媒體(音樂、電臺)

播放音樂、電臺或者是播客這些都是一輛車最為常見語音交互的功能之一吧,開車的時候都會聽一些音頻類內(nèi)容,對于這個功能播放、暫停和切換歌曲等功能外,電臺快速選擇,針對這些功能我們可以劃分一些子功能對應(yīng)的典型話術(shù)。

音樂-話術(shù)

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

  • 播放音樂

按歌手 → 我想聽霉霉的歌、播放周杰倫的歌

歌曲名稱搜索 → 播放天外來物、來一首七里香

歌手名稱+歌曲名稱組合精準(zhǔn)定位(因為有很多翻唱的曲目) → 播放周杰倫的七里香

按照語種 → 我想聽粵語歌、放一些英文歌

按照曲風(fēng) → 來點爵士音樂、播放搖滾音樂

  • 根據(jù)音源播放語

在線音樂 → 播放qq、網(wǎng)易云、酷我音樂等等(因為每一家車廠合作的音樂供應(yīng)商不一樣)

藍牙音樂 → 播放藍牙音樂、跳轉(zhuǎn)到藍牙音樂、放藍牙歌曲、切換到藍牙音樂、我要聽藍牙音樂

U 盤音樂 → 播放U盤音樂、聽U盤音樂的歌、跳到U盤音樂

  • 音樂播放控制命令

切換當(dāng)前播放列表上一首歌 → 切到上一首、上一首歌

切換當(dāng)前播放列表下一首歌 → 放下一首音樂、切下一首

換一首歌播放 → 換一首歌、換一個音樂、換個歌

暫停歌曲 → 暫停音樂、音樂暫停、停止播放音樂、不想聽歌了

繼續(xù)播放 → 繼續(xù)播放音樂、播放音樂

針對于音樂這個模塊的基礎(chǔ)語言先講到這邊了,因為在線音樂的功能相對比較多,所以后續(xù)我會對于 QQ 音樂、網(wǎng)易云、酷我音樂等在線音樂額外的語言控制命令再寫一篇續(xù)集。

電臺-話術(shù)

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

  • 播放電臺

打開電臺 → 打開/開啟收音機、聽廣播、播放電臺/收音機/廣播/Radio

按頻率收聽 → 調(diào)頻<104.5>、播放調(diào)頻<104.5>、收聽調(diào)頻<104.5>、廣播<891>

按頻段+頻率搜索收聽 → 我想聽FM<104.5>、FM<104.5>、收聽/播放/我要聽FM<104.5>、收聽AM<1045>

按電臺頻道搜索收聽 → 我想聽音樂類電臺、我要聽上海<民生聊聊>電臺、收聽<交通>/<新聞>廣播

按在線音源+音頻類型搜索并播放 → 播放喜馬拉雅的相聲

按藝術(shù)家+音頻類別搜索并播放 → 我想聽郭德綱的相聲

  • 播放源

喜馬拉雅 → 收聽/打開/我想聽 喜馬拉雅

FM → 打開/收聽/我想聽/播放/我要聽 FM

AM → 打開/收聽/我想聽/播放/我要聽 AM

  • 電臺掃描

掃描電臺 → 掃描電臺、搜索電臺、重新搜臺、搜尋電臺、搜索頻道、掃描頻道

  • 電臺輪播

輪播電臺 → 瀏覽電臺、電臺瀏覽、電臺輪播、輪播電臺、快速瀏覽

  • 電臺播放控制命令

上一個電臺 → 上個頻道、上一個臺

下一個電臺 → 下一個臺、切到下一個臺

換臺 → 換一個臺

暫停電臺 → 暫停電臺播放

收藏/訂閱 節(jié)目 → 收藏、收藏這個、添加收藏、加入收藏

取消 收藏/訂閱 節(jié)目 → 取消收藏、收藏取消

車輛控制-話術(shù)

基本功能包括車內(nèi)空調(diào)溫度調(diào)節(jié)、控制車窗開關(guān)、后視鏡角度的調(diào)節(jié),還可以切換駕駛模式、變換檔位等等。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

  • 空調(diào)控制

空調(diào)控制 ON/OFF → 打開空調(diào)、關(guān)閉空調(diào)

空調(diào) Auto → 打開自動空調(diào)、自動空調(diào)開啟

空調(diào)打開+模式 → 太冷了、好熱?。z索到關(guān)鍵詞,制冷/熱進行切換模式)

空調(diào)風(fēng)量增減 → 風(fēng)量大/小一點、風(fēng)大/小一點

設(shè)置風(fēng)量級別 → 風(fēng)量設(shè)設(shè)為2級、風(fēng)量調(diào)成2級、風(fēng)量最大/小

空調(diào)溫度增減 → 溫度高/低一點、溫度調(diào)高/低一檔

設(shè)置溫度級別 → 溫度調(diào)到xx度、溫度設(shè)置xx度、溫度調(diào)到最高/最低溫度(空調(diào)溫度調(diào)整到對應(yīng)指)

空調(diào)吹風(fēng)模式 → 吹臉/腳、吹臉吹腳、吹腳前除霜、前除霜(前除霜:處理前擋風(fēng)玻璃的)

后窗除霜 → 打開后除霜/霧、打開后窗加熱、后擋風(fēng)玻璃除霜/霧

  • 車窗

開啟/關(guān)閉車窗 → 開/開啟/打開/關(guān)/關(guān)閉 車窗(未指定某一個窗戶,打開/關(guān)閉所有車窗戶)

指定開啟/關(guān)閉車窗 → 開/開啟/打開/關(guān)/關(guān)閉 - 左前/右前/左后右后窗 、 打開/關(guān)閉主駕旁邊車窗、打開/關(guān)閉前排窗、打開/關(guān)閉后排窗、打開/關(guān)閉全部窗戶

車窗開啟/關(guān)閉到具體數(shù)值 → 車窗開/關(guān)一半(1/2)(車窗調(diào)節(jié)范圍0-100%,根據(jù)不同車廠設(shè)定值為準(zhǔn))

  • 情景模式

前文中有提到 TTS 反饋,那我就在車輛控制中情景模式詳細舉例子給大家講解一哈。

清涼模式 → 打開/開啟/關(guān)閉 清涼模式 TTS反饋 清涼模式已打開/關(guān)閉、清涼模式已處于打開狀態(tài)

溫暖模式 → 打開/開啟/關(guān)閉 溫暖模式 TTS反饋 溫暖模式已打開/關(guān)閉

雨雪模式 → 打開/開啟/關(guān)閉 雨雪模式 TTS反饋 雨雪模式已打開/關(guān)閉、即將關(guān)閉車窗,請注意安全

抽煙模式 → 打開/開啟/關(guān)閉 抽煙模式、我想抽煙 TTS反饋 抽煙模式已打開/關(guān)閉

導(dǎo)航-話術(shù)

導(dǎo)航是我們最常用的功能之一,對于用戶而言輸入地址是一件頭疼的事情,所以在導(dǎo)航去目的地的時候,直接語音輸入后,匹配所需要導(dǎo)航的目的地,讓語音助手幫你直接導(dǎo)航,還可以詢問語言助手到達目的地時間和距離播報,有的車機導(dǎo)航系統(tǒng)還可以支持語音縮放地圖大小,省得兩只手指在觸控屏幕進行放大縮小操作手勢,在導(dǎo)航中的使用語音主要的目的就是便捷與高效。導(dǎo)航中的執(zhí)行邏輯我這邊就不做過多敘述,因為相對要更專業(yè)點,后續(xù)有機會我再深挖講解。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

  • 導(dǎo)航

公司 → 我要去公司、導(dǎo)航到公司、去公司、上班了

回家 → 我要回家、導(dǎo)航回家、回家了

注:如果沒有設(shè)置公司/家的地址 需要進入設(shè)置公司/家的具體地址流程,設(shè)置完畢之后,方可語言導(dǎo)航去公司/家

附近加油站 → 導(dǎo)航到附近/周圍/周邊加油站、幫我找個最近的加油站

當(dāng)前位置→導(dǎo)航到模糊的POI(會產(chǎn)生多個結(jié)果) → 導(dǎo)航到火車站(拿上海舉例子:上海有虹橋火車站、上?;疖囌尽⑸虾D险?、松江站、上海西站,因此產(chǎn)生了多個結(jié)果后,語音助手還會繼續(xù)問到你需要導(dǎo)航到具體那個火車站,如果時間超過定義時間將默認為第一個)

當(dāng)前位置→導(dǎo)航到POI簡稱 → 導(dǎo)航到人廣(人民廣場,要不要和我一起去吃炸雞?? 哈哈哈)、帶我去交大(交通大學(xué))

  • 增加途徑點

附近其他 → 導(dǎo)航附近三甲醫(yī)院

搜索指定位置+指定類型 POI → 幫我找一下南京西路的日式餐廳

搜索指定距離+指定類型 POI → 兩公里以內(nèi)的停車場、一公里中式快餐店

搜索指定位置+指定品牌 POI → 南京西路的古馳店

  • 導(dǎo)航距離/時間的播報

查詢途徑點的距離播報 → 距離南京西路還有多遠、距離下一個途徑點距離還有多少

查詢途徑點到達耗時播報 → 到南京西路還需要多久、距離下一個途徑點還要多長時間

電話-話術(shù)

在駕駛過程如果需要撥打電話,是一件不太容易的事情,而且是極其危險的,所以需要結(jié)合語音進行來輔助,接聽/掛斷不管是屏幕觸控還是方向盤的硬按鍵都可以直接操作,體驗還不錯,對于不習(xí)慣語音的的人來說該功能點可以替代,但總體來說,語音接通/掛斷會優(yōu)于屏幕觸控,硬按鍵對于長期使用來說可能會有優(yōu)過語音,對于用戶來說,在安全駕駛前提下,哪種使用方式習(xí)慣就用哪種。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

  • 撥打電話

聯(lián)系人姓名 → 打電話給老媽、呼叫老爸、聯(lián)系哥哥、給姐姐打電話

撥打電話號碼 → 打電話給12315、打電話給18015888888

撥打常用黃頁名 → 打電話給中國電信、給上海銀行打電話

  • 接聽/掛斷/重撥/回撥

接聽 → 接聽/接電話/接通電話/接聽電話

掛斷 → 掛斷/掛電話/掛斷電話/掛掉電話

重撥 → 重撥電話

回撥 → 回撥電話

對話設(shè)計

對話設(shè)計是基于人們的對話的設(shè)計語言,它集合多個設(shè)計的內(nèi)容,其中包括語音用戶界面設(shè)計、交互設(shè)計、視覺設(shè)計、動畫設(shè)計、語音對話腳本設(shè)計、乃至還有音頻設(shè)計增加語音助手的靈動性。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

對話設(shè)計的是否成功與否最重要的就是個性,現(xiàn)在市場上的許多車載語音系統(tǒng)對話聽起來還是基本很相似,是因為很多公司都沒有專業(yè)的對話設(shè)計師,要么是程序員、產(chǎn)品經(jīng)理、好一點的公司組建一個語音組,都是從其他行業(yè)轉(zhuǎn)化過來,然后將各個大廠的語音對話研究一下,就上崗了,國內(nèi)優(yōu)秀的 VUI 設(shè)計真的很稀缺,也是很缺少的人才,我可不想再用語音交互的時候語音助手和我說“對不起,我沒懂你的意思”

對話設(shè)計師在規(guī)劃用戶在具體每個功能模塊區(qū)域內(nèi)做什么,同時還要考慮用戶的需求和技術(shù)限制,對話的策略,是代表著該語音系統(tǒng)完整的用戶體驗,也包含這詳細的規(guī)范定義流程和底層邏輯。

這邊需要著重的講一個小知識點:

我們會有一個誤區(qū),認為“對話”僅只是說 or 聽到的內(nèi)容,其實對話本質(zhì)上是多模態(tài)的,對話的核心內(nèi)容是對話的流程和底層邏輯,圖形界面的邏輯一般都不太會用在對話內(nèi)容的設(shè)計方面,基本上他們兩是一個獨立的個體。

對話設(shè)計需要注意點

1. 語音簡短化

車載語音的對話做的是否 OK?是基于對話內(nèi)容時間的長短,因為用戶沒辦法像查看 UI 界面內(nèi)容那樣,去查看語音的內(nèi)容。根據(jù)人的平均記憶力,如果車載語音虛擬形象說了,關(guān)于這個話題很多內(nèi)容,用戶可能無法記全所有的內(nèi)容,這對于對話將大打折扣,因此在對話過程中需要嚴(yán)格遵循 → 簡短明了,讓每一個文字都有意義,避免重復(fù)的短語,可以讓用戶快速的做決定。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

2. 響應(yīng)等待設(shè)計

當(dāng)用戶在用導(dǎo)航功能的時候,語音對話說“導(dǎo)航去火車站”,如果在上海的話,就有好幾個火車站,需要用戶再次去選擇,1 虹橋火車站、2 上?;疖囌尽? 上海南站、4 上海西站,我們在做項目的時候,體驗設(shè)計師給他的定義是如果用戶超過 8 秒還沒有進行選擇的話,默認是選擇第一個,如果第一個目的地不是我想要的,那么我需要重新通過語音再次輸入信息。我覺得默認選擇這個選項可能會有些不妥,如果這期間來一個電話或者是微信的語音電話,那么我是不好通過語音去選擇的,如果汽車不是在駕駛的狀態(tài),可以手動觸控屏幕進行選擇 OK 沒問題,如果是駕駛狀態(tài)下,就需要優(yōu)化前面默認選擇項了。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

我的想法

(1)超過 8 秒鐘后,默認選擇第一個沒有問題,但是在用戶結(jié)束自己之前任務(wù)狀態(tài)后,可以說重新選擇目的地,將之前的搜索出來的火車站結(jié)果都再次調(diào)出來,提供用戶重新去選擇。

(2)這塊就更智能化一些了(這個有一點前瞻性的意思,研發(fā)要是看到這個需求估計要揍死我),當(dāng)語音助手檢測用戶正在忙的狀態(tài)時候,在 8 秒鐘都沒有做出選擇,那么語音助手可以從第一個目的地開始播報,用戶可以通過方向盤 OK 硬按鍵去選擇自己所需要導(dǎo)航的目的地,在駕駛過程中,方向盤的硬按鍵安全性遠高于中控屏幕的點擊。

3. 避免過多的選擇

給用戶提供選擇的選項列表的時,最好不要超過三個選項,給用戶較少的選擇,能夠讓用戶更明確去抉擇,減少過多選項對于用戶的干擾,剛剛上面導(dǎo)航那個案例排除,上?;疖囌菊娴奶嗔藳]辦法,其他城市應(yīng)該還好都是 1-3 個左右。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

我的想法

上面實際案例就是強行逼迫用戶去選擇一個,這種體驗很差,有一種場景,如果這三個選項都不是我想要的,你就得重新說,幫我推薦一下附近的餐廳,想想這種體驗就不是我想要的,我覺得可以增加一些情感化的設(shè)計在里面,如果這三個選項都不是我想要的。

我可能會說“這些我都不想去、能不能幫我再推薦其他的”語音助手說“你可真挑食、好的,那我就再幫你找找其他美食”(我的意思就是要讓機器多去自我學(xué)習(xí),更加智能化、情感化貼近于用戶的交流,這樣用戶才會更愿意使用語音交互)

上訴的場景是對于這塊區(qū)域不熟悉的用戶來搜尋美食,如果用戶有直接目的需要吃什么類型的餐飲的時候,語言助手只需要推薦相關(guān)美食就好。

用戶說“幫我找一下附近的海底撈”語音助手說“附近有三家海底撈,您是要去哪一家...(播報三家信息)”

(播報三家海底撈的位置和距離,甚至我想是不是可以增加排隊人數(shù)的播報,如果排隊人很多就可以換一家,接下來就可以和語音助手直接說幫我預(yù)約好位置,省的用戶到店面還要進行排隊等候)

4. 不要假設(shè)用戶知道該做什么

在做對話設(shè)計的時候千萬別考慮用戶的思考邏輯,每個人的思考邏輯都不一樣的,所以不用去猜想用戶的想法,只需要提供有用的信息讓用戶自己選擇好了,前面有提到對話設(shè)計是講究有邏輯性的,你在設(shè)計對話劇本的時候不可能就只考慮一條線。

舉個簡短的例子,你在設(shè)計一個訂購飛機票語音對話流程,你想法是,首先先確定目的地,哪里起飛去哪里,然后再選擇時間點起飛。假設(shè)用戶直接說:“幫我預(yù)定早上八點的飛機,飛往深圳?!蹦菃栴}來了一開始是用戶是說的時間,最后只說了目的地,沒有有說出發(fā)地,因此在語音設(shè)計劇本的時候,你需要將所有能出現(xiàn)的狀況都考慮進去。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

5. 語言文案設(shè)計一致性

在圖形設(shè)計之前 UE 也需要將動詞、名詞之間的搭配提前定義好,需要全局保持一致性,這塊內(nèi)容有在我第二篇文章提到過,因此在對話設(shè)計過程中也要格外注意。

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

6. 不要信息轟炸用戶

現(xiàn)實中我們正常處理事物的時候,也是將事物劃分成幾塊,然后按照計劃步驟進行,而不是一股腦子亂做,車載語音設(shè)計也是如此,作為一個正常的用戶來說,我們一次性說出的需求并不會很多,不會像專業(yè)的車機測試人員一樣,去敘述一大堆信息去檢測機器的運轉(zhuǎn)效率,和一個處理信息的準(zhǔn)確性,每次出差去南京走查,都會聽到測試人員巴拉巴拉 一直說,我腦袋都大了,所以我們正常用戶都是逐步的去說消息的,舉個列子

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

7. 避免使用專業(yè)術(shù)語

舉一個場景的例子,當(dāng)你在道路上開車,需要停在路邊接朋友,朋友還沒有到達指定位置,或者該位置是不可以停留的,語音助手正確說法“這邊不可以停車,不然交警叔叔會罰款的,趕緊溜,我?guī)湍阏乙粋€附近可以停車的地方吧” 錯誤的說法:“你觸犯了了我國《交通法》第 XXX 條,......此處省略法律條文這邊是禁止停車的”

車載設(shè)計萬字干貨!超全面的 HMI 「語音設(shè)計」基礎(chǔ)知識科普

首先當(dāng)你聽到觸犯法律,你的第一想法 what?這是什么鬼,給用戶的感覺是很糟糕的,因為法律消息通常會包含長閱讀并且還不自然的語言,給用戶帶了不好的體驗,并且還未給解決的方案。一個好的語言設(shè)計方案會讓人喜歡上使用它。

最后來個總結(jié):

后續(xù)我會對于前瞻性的語音進行探索,再寫一篇。前瞻性的就再舉一個吧:通過面部掃描,檢測到用戶不開心的時候,車載系統(tǒng)可以推薦一些治愈系的電臺,或者可以讓用戶放松、舒緩心理的的歌曲,或者你進行人機交談(這個就比較高級,需要讓語音系統(tǒng)進行大數(shù)據(jù)自我學(xué)習(xí),達到能夠和人能正常交流),讓我們一起展望未來吧。

文章中如有不足之處,歡迎補充交流,我們下期見

收藏 149
點贊 47

復(fù)制本文鏈接 文章為作者獨立觀點不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。