越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

設(shè)計(jì)也需要在每個(gè)場(chǎng)景中分別做出判斷,行業(yè)通用的部分沉淀,以及行業(yè)特性的個(gè)性化設(shè)計(jì)思考,都是需要不斷的去嘗試和打磨的。而智能互動(dòng)設(shè)備作為一種趨勢(shì),也是設(shè)計(jì)師去發(fā)揮所長(zhǎng)的沃土。

一、5號(hào)小蜜:智能互動(dòng)設(shè)備的初期準(zhǔn)備

在如今智能硬件設(shè)備,語音互動(dòng)的大趨勢(shì)下,我們針對(duì)實(shí)體智能互動(dòng)的硬件,從想法 – 設(shè)備 – 技術(shù) – 設(shè)計(jì) – 場(chǎng)景,總結(jié)沉淀了部分探索經(jīng)驗(yàn)。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

首先交代一下背景:

在阿里小蜜語音助手的形態(tài)下,延伸出了很多智能相關(guān)的研究和探索,其中智能硬件也是我們想要去發(fā)展的一部分。在這種情況下,以「5號(hào)小蜜」為名稱的智能互動(dòng)硬件設(shè)備應(yīng)勢(shì)而生。

(名稱解釋:在決定做這個(gè)產(chǎn)品的初期,是以落地到公司的5號(hào)行政樓為場(chǎng)景的前提下進(jìn)行的設(shè)想,所以叫「5號(hào)小蜜」)。

在有了這個(gè)想法后,5號(hào)小蜜進(jìn)行了1.0版本的研究和設(shè)計(jì),在項(xiàng)目初期我們的承載硬件主要是以55寸,比例為16:9的液晶屏幕為主,用機(jī)器人的虛擬形象進(jìn)行語音的互動(dòng),其中的場(chǎng)景設(shè)定也是在訪客進(jìn)入到5號(hào)行政樓進(jìn)行互動(dòng)的能力。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

二、智能互動(dòng)設(shè)備的框架拆解

在有了初步的進(jìn)展之后,我們以設(shè)計(jì)師的視角總結(jié)了智能互動(dòng)類設(shè)備的基礎(chǔ)框架,為我們之后的升級(jí)和完善進(jìn)行了整體的方向指導(dǎo)。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

首先智能互動(dòng)設(shè)備的核心支撐能力一定是算法的能力,而當(dāng)前市面上的智能硬件大多數(shù)是以語音助理的形態(tài)出現(xiàn)的,因此對(duì)于設(shè)計(jì)師來說,VUI 是重要的一環(huán),5號(hào)小蜜不單單是語音的交互,也是視覺上的交互。因此在感知層面的設(shè)計(jì)上來說,是「VUI+GUI」也就是聽覺和視覺的互動(dòng)(但在硬件多樣發(fā)展的今天,觸覺類也應(yīng)該是要考慮到感知層面的一部分)。

VUI+GUI 對(duì)比傳統(tǒng)語音交互會(huì)有一些優(yōu)勢(shì)體現(xiàn):在互動(dòng)方面,語音可以理解為面,單一面?zhèn)鬟f信息是有限的,如果語音和界面結(jié)合起來,就是從兩個(gè)單一面形成了空間,可以承載更多的信息。

舉個(gè)例子:人與人在交流中不止是語言傳遞的互動(dòng),可以從面部表情傳遞出喜怒哀樂;肢體語言傳遞出興奮度和性格特質(zhì)。綜合起來,我們的交流才會(huì)更順暢。

在物理層面而言,是硬件設(shè)備的選擇:液晶屏幕、玻璃屏幕(透明、非透明)、全息投影等。

在初期,我們的選擇是液晶屏幕,這個(gè)是最基礎(chǔ)的承載硬件,也是成本最低的硬件。而其它選擇的硬件也有優(yōu)劣之分,透明玻璃屏適合導(dǎo)購(gòu)的場(chǎng)景,背后是否有商品的出現(xiàn),是從傳統(tǒng)的觸覺互動(dòng)進(jìn)行了更多承載信息的進(jìn)化。非透明玻璃屏適合更沉浸的助理場(chǎng)景,全息投影會(huì)更接近真人的感受,也是智能感受最強(qiáng)的一類,每一種硬件方式都有適合的場(chǎng)景,這個(gè)是我們需要去權(quán)衡的。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

在以設(shè)計(jì)師的身份參與過程中,我們更多的是以設(shè)計(jì)的視角和硬件、場(chǎng)景、技術(shù)等進(jìn)行搭配合作,所以在過程中,會(huì)參考多方面的因素,影響最后落地的結(jié)果。

1. 感知層面的設(shè)計(jì)策略:視覺層

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

在2.0初期,我們先整理了最直接的感官層的一部分——視覺感受,以此為基礎(chǔ)為產(chǎn)品定調(diào),以最直接的表現(xiàn)層為手段幫助產(chǎn)品建立視覺體系。

首先我們內(nèi)部腦暴統(tǒng)一同步了本次升級(jí)的目標(biāo):讓小蜜更智能,更有服務(wù)感。一個(gè)是本身我們?cè)谧龅氖虑榫褪侵悄芟嚓P(guān)的研究,另外在落地的場(chǎng)景訪客中心承載的也是服務(wù)的屬性,所以在設(shè)計(jì)方面就抓取了兩個(gè)心智方向的關(guān)鍵詞:智能、服務(wù)。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

在關(guān)鍵詞的引導(dǎo)下,先建立情緒板,整合出表現(xiàn)層的特性。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

抽出智能感受類的關(guān)鍵詞,可以是抽象或者具象的描述。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

接著整理出服務(wù)相關(guān)的視覺屬性。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

根據(jù)關(guān)鍵詞的延展,得到了視覺語言的方向,但是在推導(dǎo)中我們發(fā)現(xiàn)智能和服務(wù)有些畫面更像是互補(bǔ)色之間的關(guān)系,有一定的對(duì)立面,所以要從中調(diào)和每個(gè)關(guān)鍵詞在界面中的占比。同時(shí)要考慮是不是有減少兩者沖突的辦法,所以在多次嘗試后決定將1.0版本中的機(jī)器形象換成真人。

首先在行政樓場(chǎng)景中,真人會(huì)帶來更多的親切感,與服務(wù)場(chǎng)景更契合;其次界面關(guān)鍵詞的分配方面也會(huì)有考量,在氛圍中我們更希望帶來智能感受、在對(duì)話中我們更希望是親切的服務(wù)感,因此真人的形象出現(xiàn)是一個(gè)比較合適的策略。

而且服務(wù)的視覺概念也從我們常常感知到的二維變成了多維的角度,從單一的界面變成了人設(shè)、服裝、肢體語言、面部表情等多方結(jié)合的綜合體。因此這兩個(gè)關(guān)鍵詞延展出來的部分就有了各自的分工:智能感更多的體現(xiàn)在界面氛圍上;服務(wù)感更多體現(xiàn)在人物上,兩者結(jié)合的會(huì)更加潤(rùn)滑。

下圖是關(guān)鍵詞占比的界面嘗試過程灰機(jī)稿。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

在嘗試過程中,畫面一步步清晰了起來,智能+服務(wù)也能更多體現(xiàn)出來,最終通過提煉過程中的視覺語言,形成了最終的畫面。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

在整體視覺感受設(shè)計(jì)的同時(shí),人物的視覺點(diǎn)也在同步進(jìn)行,我們對(duì)人物進(jìn)行了性別、著裝、動(dòng)作、面部表情的設(shè)定,整體目標(biāo)以之前服務(wù)感中總結(jié)出的友善、輕松為關(guān)鍵詞。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

最終畫面(其中一款服裝是考慮之后場(chǎng)景的拓展性,整個(gè)以智能感受為主)。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

2. 感知層面的設(shè)計(jì)策略:聽覺層

在描述完視覺設(shè)定后,來看一下聽覺的方面,也就是語音的互動(dòng)。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

首先,語音互動(dòng)的核心能力還是在算法上面,因此語音交互也是和技術(shù)能力相輔相成,5號(hào)小蜜的技術(shù)手段也比較豐富,主要是以下幾種:ASR、TTS、QA、面部跟蹤、面部重塑面部跟蹤渲染等 AI 技術(shù)模塊。理論上只要獲得充足的人物視頻+語音數(shù)據(jù),技術(shù)可模擬任意指定人物。數(shù)據(jù)越多,面部和語音的還原度越逼真。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

其中,為獲取原始數(shù)據(jù),需要進(jìn)行數(shù)據(jù)的采集,主要是在采集室里對(duì)語音、圖像進(jìn)行收錄,大致技術(shù)的流程如下所示:

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

在這些技術(shù)背景下,語音的互動(dòng)更多的是考慮如何在與真人的對(duì)話中,體驗(yàn)更加順暢。

下圖為核心的 Flow:

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

在小蜜與用戶交流的部分做了標(biāo)記,也是語音交互的核心內(nèi)容區(qū)。為了方便整個(gè)流程連貫起來,還是從最初的部分開始,講述一個(gè)完整的劇本。

用戶從行政樓走進(jìn),一般會(huì)有幾種意圖:開會(huì)(查找會(huì)議室)、來訪(了解阿里文化等)、參觀(閑聊)根據(jù)這些場(chǎng)景我們進(jìn)行了兩個(gè)關(guān)鍵節(jié)點(diǎn)的設(shè)定:吸引、交流。由于結(jié)束對(duì)話屬于弱互動(dòng),所以暫不列入重點(diǎn)。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

以上為語音互動(dòng)的核心部分,其余還有用戶結(jié)束對(duì)話的聲音動(dòng)作反饋——「再見」+揮手等;未知問題的回復(fù)處理——進(jìn)行多種兜底話術(shù)的配置;中途離場(chǎng)的用戶——小蜜15S內(nèi)回復(fù)初始狀態(tài)等。

3. 物理層面策略:硬件、場(chǎng)景

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

在考慮界面語音互動(dòng)的同時(shí),也要考慮硬件方面帶給體驗(yàn)的影響,比如設(shè)備的主要構(gòu)成,MIC、音響、支架、外觀顯示器等主要硬件。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

MIC 的技術(shù)手段是單軌拾音,因此需要保證在有效距離內(nèi)收音(機(jī)器前會(huì)張貼最佳距離的腳印貼紙,以保證對(duì)話收音)。顯示器會(huì)制作可調(diào)整的15°角傾斜,考慮反光、身高視角等情況。機(jī)器總高度控制在1.8M,用戶眼睛與小蜜眼睛保持平視,最佳觀看高度在1.7M左右的平均值,以覆蓋大部分用戶的使用感受。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

△ 年會(huì)亮相圖

下圖為整個(gè)硬件的構(gòu)成部分以及運(yùn)作傳輸圖。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

在硬件組裝完畢后,會(huì)進(jìn)行收音的測(cè)試,在實(shí)際使用場(chǎng)景 – 公共環(huán)境(嘈雜環(huán)境)下用錄音(ASR識(shí)別)的方式來收集不同位置的收音狀況(保證同等條件下,比如分貝相同)來收集數(shù)據(jù),最后判定這個(gè) MIC 的硬件是不是最合適的。

越來越火的智能互動(dòng)設(shè)備該如何設(shè)計(jì)?來看阿里這個(gè)實(shí)戰(zhàn)案例!

經(jīng)過綜合多方位設(shè)計(jì)后,設(shè)備才能見到雛形,本身智能互動(dòng)領(lǐng)域就是多維度的綜合體,設(shè)計(jì)師參與在其中也會(huì)從單一的視覺、交互維度去向更全面的維度思考,使每一個(gè)環(huán)節(jié)串聯(lián)起來,打造更好的 UX體驗(yàn)。

最后的思考

從這次的項(xiàng)目來看,我們?cè)谧鍪虑榈某跗诰托枰幸粋€(gè)完整的目標(biāo)定義,Lot設(shè)備的應(yīng)用場(chǎng)景考量等等,這次綜合升級(jí)只是考慮了單一的行政場(chǎng)景,解決的是咨詢類的問題,因此設(shè)計(jì)的鏈路也是單一且淺薄的。但是產(chǎn)品的發(fā)展一定是要向商業(yè)化邁步的,比如:熱門的導(dǎo)購(gòu)場(chǎng)景,與淘系新零售的戰(zhàn)役契合,結(jié)合淘寶生態(tài)配合多種垂直行業(yè),機(jī)器人作為智能客服出現(xiàn)在售前、售中、售后的服務(wù)等等。

設(shè)計(jì)也需要在每個(gè)場(chǎng)景中分別做出判斷,行業(yè)通用的部分沉淀,以及行業(yè)特性的個(gè)性化設(shè)計(jì)思考,都是需要不斷的去嘗試和打磨的。而智能互動(dòng)設(shè)備作為一種趨勢(shì),也是設(shè)計(jì)師去發(fā)揮所長(zhǎng)的沃土。

「如何設(shè)計(jì)出優(yōu)秀的智能產(chǎn)品」

收藏 19
點(diǎn)贊 25

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。