對(duì)話式的AI智能體怎么設(shè)計(jì)?我總結(jié)了一個(gè)設(shè)計(jì)框架

ChatGPT 不僅帶動(dòng)了 AI 的火爆出圈,也帶動(dòng)了對(duì)話式交互的一種形態(tài),那如果要設(shè)計(jì)這樣一個(gè)對(duì)話式的 AI 智能體,有哪些設(shè)計(jì)內(nèi)容要做呢?

借之前做 POC 項(xiàng)目時(shí)的思考,分享一個(gè)設(shè)計(jì)框架。

更多相關(guān)干貨:

一、交互邏輯

雖然最終使用起來好像和一般的對(duì)話軟件相似,但在交互流程的設(shè)計(jì)上不僅需要設(shè)計(jì)師站在第三者角度考慮對(duì)話,還要作為其中一個(gè)提供服務(wù)的對(duì)話者來思考。

整個(gè)交互邏輯可以分為三個(gè)階段

第一階段:開場(chǎng)

開場(chǎng)又分兩種情況,一個(gè)是初次接觸用戶時(shí),一個(gè)是每次新對(duì)話開始時(shí)。一般包含對(duì)用戶的問候語以及對(duì)自己的介紹(是什么、可以提供什么幫助、怎么使用)。

第二階段:溝通過程

基本的問答流程是:

① 接收信息:接到用戶輸入的內(nèi)容

② 處理信息:界面上表現(xiàn)為加載狀態(tài)

對(duì)話式的AI智能體怎么設(shè)計(jì)?我總結(jié)了一個(gè)設(shè)計(jì)框架

③ 輸出信息:界面上表現(xiàn)為流式回復(fù)。如果底層技術(shù)支持類似 deepseek 的深度思考模型,因?yàn)樗惴ㄟ\(yùn)算時(shí)間加長(zhǎng)、又會(huì)分為分析過程和正式回復(fù)內(nèi)容的信息輸出。

流式回復(fù)指的是像打字機(jī)一樣一個(gè)字一個(gè)字地呈現(xiàn)回復(fù)內(nèi)容,而不是等全部處理完后一次性展示。

這種展示方式有幾個(gè)好處:

  1. 讓用戶能更早看到部分回復(fù)內(nèi)容,減少等待感
  2. 模擬更自然的對(duì)話節(jié)奏,增加交互的真實(shí)感
  3. 當(dāng)回復(fù)內(nèi)容較長(zhǎng)時(shí),能讓用戶提前開始閱讀,提高效率

④ 完成輸出:完成輸出后,還有 2 個(gè)細(xì)節(jié)需要設(shè)計(jì)

對(duì)此段輸出內(nèi)容的反饋評(píng)價(jià)。這塊功能可以幫助工程師和技術(shù)人員不斷優(yōu)化智能體,現(xiàn)在智能體設(shè)計(jì)上的常見功能,也可以在這里加一些針對(duì)這段信息的其他功能入口

補(bǔ)充延展提問,類似于進(jìn)一步的操作提示。

對(duì)話式的AI智能體怎么設(shè)計(jì)?我總結(jié)了一個(gè)設(shè)計(jì)框架

注意事項(xiàng):

① 在輸出信息之前,也要分為智能體能理解和不能理解兩個(gè)情況,預(yù)先設(shè)置智能體不能理解用戶輸入時(shí)的反饋。

② 如果是嵌入式的對(duì)話智能體,比如針對(duì)某個(gè)更大系統(tǒng)的 AI 助手,還需要考慮收起狀態(tài)時(shí)的互動(dòng)交互和系統(tǒng)本身的聯(lián)動(dòng)交互,設(shè)計(jì)考慮的內(nèi)容會(huì)更多。

對(duì)話式的AI智能體怎么設(shè)計(jì)?我總結(jié)了一個(gè)設(shè)計(jì)框架

二、IP 設(shè)計(jì)

由于這種對(duì)話式的智能體替代的是一個(gè)可以用聊天的方式、提供服務(wù)的人類,那么這個(gè)人類的性格、特點(diǎn)、形象、語氣都是可以設(shè)計(jì)的。相比起有一個(gè)具象化的傳統(tǒng) IP 設(shè)計(jì),對(duì)話式智能體的性格、特點(diǎn)、形象等會(huì)通過整個(gè)界面、語氣和回答方式傳遞給用戶。

如有支持自定義風(fēng)格的功能,還涉及到多套 IP 要素的構(gòu)建。

智能體的 IP 設(shè)計(jì)可以考慮以下幾個(gè)基本要素:

① 性格與個(gè)性特征:定義智能體的基本性格,如嚴(yán)謹(jǐn)專業(yè)、友善活潑、幽默風(fēng)趣等,這將影響其與用戶互動(dòng)的方式

② 語言風(fēng)格:根據(jù)性格特征設(shè)計(jì)對(duì)應(yīng)的表達(dá)方式,包括:

  1. 語氣:正式/輕松/幽默等
  2. 用詞習(xí)慣:專業(yè)術(shù)語使用頻率、是否使用口語化表達(dá)
  3. 句式結(jié)構(gòu):簡(jiǎn)短/詳細(xì)、直接/婉轉(zhuǎn)等

③ 專業(yè)背景:設(shè)定智能體的專業(yè)領(lǐng)域和知識(shí)范圍,這將影響其回答問題的深度和廣度

④ 社交角色:明確智能體與用戶的關(guān)系定位,如專業(yè)顧問、學(xué)習(xí)助手、生活伴侶等

⑤ 視覺形象:

  1. LOGO 和界面元素
  2. 動(dòng)作符號(hào)

對(duì)話式的AI智能體怎么設(shè)計(jì)?我總結(jié)了一個(gè)設(shè)計(jì)框架

Kimi 和豆包在開場(chǎng)對(duì)話中體現(xiàn)出來的性格、語言、習(xí)慣等。

總的來說,對(duì)話式 AI 智能體設(shè)計(jì)的不是一個(gè)簡(jiǎn)單的對(duì)話系統(tǒng),而是去幫助技術(shù)轉(zhuǎn)化為一個(gè)有溫度的對(duì)話者的過程。

一起共勉、共進(jìn)~!

收藏 9
點(diǎn)贊 30

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。