網(wǎng)易 UEDC – 盛少奇:互聯(lián)網(wǎng)時代的「長尾理論」,讓我們重新認(rèn)識了小眾用戶、小眾產(chǎn)品、亞文化群體的意義和價值。網(wǎng)絡(luò)上的亞文化群體,包括嘻哈文化、二次元、同性戀文化、宅文化、小清新、非主流等等,小眾群體包括小眾作者的粉絲、小眾產(chǎn)品的用戶等;現(xiàn)實(shí)生活中,亞文化群體則包括性工作者、吸毒者、流浪藝人等所謂的「隱藏人口」。

如何研究這些群體,收集他們的信息為我所用呢?顯然,概率抽樣、問卷調(diào)查可能是一種流行的做法。

概率抽樣的困境

在研究小眾群體或亞文化群體時,通常會面臨一系列抽樣困境:第一,這些小眾群體或亞文化群體在總體中所占比例較低,群體的規(guī)模和邊界不太清楚,很難找到合適的抽樣框;第二,小眾群體,尤其是亞文化群體的成員,常常因種種原因拒絕暴露自己的身份,這就加大了我們獲取有效信息的難度。

舉個例子:假設(shè)在 A 社交平臺上,我們的研究對象是同性戀群體,我們想了解這群用戶的情況。假設(shè) A 社交平臺有 1 億用戶,其中有 5 萬名用戶受同性戀文化影響。我們通過簡單隨機(jī)抽樣,抽取一個 10 萬人的樣本(已經(jīng)是相當(dāng)大的樣本了),從中可以得到的同性戀亞文化群體樣本也只有 50 個左右,考慮到亞文化群體較高的拒訪率,實(shí)際獲得的樣本可能更少。顯然,概率抽樣的效率極低。

受訪者驅(qū)動抽樣的優(yōu)勢

那么有沒有更好的方法呢?受訪者驅(qū)動抽樣(Respondent-Driven Sampling,下文簡稱RDS)在很大程度上能解決這種抽樣困境。RDS 抽樣承襲自雪球抽樣(snow-ball sampling),先從總體中的少數(shù)成員開始調(diào)查,由已知成員推薦符合要求的新成員,然后樣本像滾雪球一樣越來越大。雪球抽樣雖然操作簡單,但它是非概率抽樣,并非按照隨機(jī)抽樣原則來抽取樣本,失去了大數(shù)定律的存在基礎(chǔ),也就無法確定抽樣誤差,無法準(zhǔn)確地說明樣本的統(tǒng)計(jì)值在多大程度上適合于總體。

RDS 不僅具有類似雪球抽樣的易操作性,同時它又有效解決了抽樣偏誤和抽樣概率未知等問題,可以對總體情況做出相對準(zhǔn)確的估計(jì)。

RDS 抽樣的理論基礎(chǔ)源自社會網(wǎng)絡(luò)分析(social network analysis)中的小世界網(wǎng)絡(luò)(small world)理論。社會網(wǎng)絡(luò)分析是一種分析社會結(jié)構(gòu)的理論和方法,將人與人之間、群體與群體之間的聯(lián)系視為一條條連線,整個社會結(jié)構(gòu)就可以視為由各個點(diǎn)及其連線構(gòu)成的一張大網(wǎng)絡(luò)[i]。小世界網(wǎng)絡(luò)是指,網(wǎng)絡(luò)中大部分的節(jié)點(diǎn)彼此并不相連,但絕大部分節(jié)點(diǎn)之間經(jīng)過少數(shù)幾步就能聯(lián)系在一起。

如何調(diào)研小眾人群?來看網(wǎng)易設(shè)計(jì)師的有效方法!

△ 小世界網(wǎng)絡(luò)(Small-world)

哈佛大學(xué)心理學(xué)教授斯坦利·米爾格拉姆做過一次連鎖信實(shí)驗(yàn),證明平均只需要 6 步就可以聯(lián)系任何兩個互不相識的美國人,這便是著名的「六度分隔理論」。而 Facebook 2016 年公布的官方研究報(bào)告(Research At Facebook)則顯示,全球 15.9 億用戶中間,僅僅隔著 3.57 個朋友而已。

如何調(diào)研小眾人群?來看網(wǎng)易設(shè)計(jì)師的有效方法!

△ 2016年,F(xiàn)acebook上15.9億人中間,僅隔著3.57個朋友而已

弱關(guān)系的力量

提到網(wǎng)絡(luò)分析,就不能不提格蘭諾維特以及那篇令他聲名大噪的論文──《弱關(guān)系的力量》(The strength of weak ties),這篇論文是社會學(xué)史上引用率最高的論文,他本人也憑借其在網(wǎng)絡(luò)分析領(lǐng)域的杰出貢獻(xiàn),作為一個社會學(xué)家,提名了諾貝爾經(jīng)濟(jì)學(xué)獎。

論文的核心觀點(diǎn)是:與自己頻繁接觸的親朋好友是一種「強(qiáng)關(guān)系」,通過這種關(guān)系獲取到的往往是同質(zhì)性的信息。但社會上更為廣泛的是一種并不深入的人際關(guān)系(即弱關(guān)系),這種弱關(guān)系能夠使個體獲得通過強(qiáng)關(guān)系無法獲取到的信息,從而在工作和事業(yè)上、在信息的擴(kuò)散上起到?jīng)Q定作用。[ii]

如何調(diào)研小眾人群?來看網(wǎng)易設(shè)計(jì)師的有效方法!

△ 強(qiáng)關(guān)系與弱關(guān)系

RDS 抽樣依據(jù)社會網(wǎng)絡(luò)理論認(rèn)為,個人總是生活在一定的網(wǎng)絡(luò)之中,一旦我們知道了這些亞文化群體或者小眾群體的社會網(wǎng)絡(luò)構(gòu)成情況,那么我們也就能對總體人口的特征有一個比較清晰的認(rèn)識。

RDS 方法與常規(guī)抽樣方法的最大區(qū)別在于:常規(guī)抽樣方法是先從界定清晰的總體中抽取出一定數(shù)量的有代表性的樣本,然后根據(jù)樣本情況直接估計(jì)總體的參數(shù)。而在 RDS 方法中,總體是尚不清晰的,從總體的社會網(wǎng)絡(luò)中抽取樣本,先估計(jì)樣本所在社會網(wǎng)絡(luò)的情況,然后再根據(jù)網(wǎng)絡(luò)情況來推斷總體的情況[iii]。

如何調(diào)研小眾人群?來看網(wǎng)易設(shè)計(jì)師的有效方法!

△ 常規(guī)抽樣方法與RDS方法的差異

RDS抽樣的具體操作方法

  1. 研究者先任意找到幾個符合調(diào)查要求的目標(biāo)用戶,這幾個目標(biāo)用戶是我們的「種子」,研究者對種子進(jìn)行調(diào)查,并給他們發(fā)放物質(zhì)獎勵作為酬謝,這就是調(diào)查的起始輪次(wave 0)。
  2. 研究者給種子發(fā)放一定數(shù)量的調(diào)查券,調(diào)查券上必須標(biāo)明新受訪者的編號(在推算子群體在總體中所占比例會用到),讓種子把這些調(diào)查券發(fā)給自己認(rèn)識的、符合調(diào)查要求的目標(biāo)用戶,并承諾:只要得到調(diào)查券的人接受調(diào)查,不僅接受調(diào)查的人會得到物質(zhì)獎勵,推薦他來的種子也會因?yàn)橥扑]新人而得到額外獎勵。
  3. 研究者確認(rèn)持首輪調(diào)查券來接受調(diào)查的人是否屬于目標(biāo)用戶,如果符合,就對其進(jìn)行調(diào)查,調(diào)查后給他們發(fā)放獎勵,同時給招募他們的種子發(fā)放獎勵。這是研究的第一輪次(wave 1)。
  4. 研究者給每一個第一輪受訪者發(fā)放同樣數(shù)量的次輪調(diào)查券,并標(biāo)上新一輪被調(diào)查者的編號。要求他們把調(diào)查券發(fā)給自己認(rèn)識的目標(biāo)群體成員,并同樣承諾會同時為持券接受調(diào)查者和招募者發(fā)放獎勵,新的受訪者還會得到招募新人和獲得獎勵的機(jī)會。
  5. 經(jīng)確認(rèn)后調(diào)查每個持次輪調(diào)查券來接受調(diào)查的目標(biāo)用戶,并獎勵受訪者及其招募人,完成第二輪次調(diào)查(wave 2)。
  6. 重復(fù)以上步驟,進(jìn)行下一輪調(diào)查,直到達(dá)到研究設(shè)計(jì)所確定的樣本總數(shù)為止。

如何調(diào)研小眾人群?來看網(wǎng)易設(shè)計(jì)師的有效方法!

△ RDS抽樣的具體操作方法

美國社會學(xué)家赫克索恩證明了 RDS 抽樣方法是一個一階馬爾科夫過程(first-order Markovprocess)[iv],即樣本在招募被訪者的過程中會實(shí)現(xiàn)均衡,并與初始的種子相互獨(dú)立。此外,他的研究結(jié)論還證實(shí)了,研究者初始選擇的「種子」,并不需要刻意保持隨機(jī)性,而且使用 RDS 方法無需經(jīng)過太多輪次就可使樣本達(dá)到均衡。

RDS 抽樣在國外已有了豐碩的研究成果,尤其在諸如艾滋病患者、性工作者等亞文化群體中。赫克索恩也曾在互聯(lián)網(wǎng)上使用 RDS 對在校大學(xué)生抽樣,與常規(guī)概率抽樣進(jìn)行對比,并得出結(jié)論:RDS 的估計(jì)值不僅合理,還可以進(jìn)一步提高精確性。

總而言之,對于用戶研究來說,當(dāng)我們研究的群體小眾或用戶調(diào)研參與意愿低,那么 RDS 不失為一種很好的替代概率抽樣的方法。

參考文獻(xiàn):

  • 劉林平,范長煜,王婭. 被訪者驅(qū)動抽樣在農(nóng)民工調(diào)查中的應(yīng)用:實(shí)踐與評估[J]. 社會學(xué)研究,2015,30(02):149-173+244-245.
  • 趙延?xùn)|,Jon Pedersen. 受訪者推動抽樣:研究隱藏人口的方法與實(shí)踐[J]. 社會,2007(02):192-205+208.
  • Granovetter M S. The strength of weak ties[M]//Social networks.1977: 347-367.
  • Heckathorn D D. Respondent-driven sampling: a new approach to thestudy of hidden populations[J]. Social problems, 1997, 44(2): 174-199.
  • [i]趙延?xùn)|,JonPedersen.受訪者推動抽樣:研究隱藏人口的方法與實(shí)踐[J].社會,2007(02):192-205+208.
  • [ii]轉(zhuǎn)自維基百科:馬克·格蘭諾維特
  • [iii]趙延?xùn)|,JonPedersen.受訪者推動抽樣:研究隱藏人口的方法與實(shí)踐[J].社會,2007(02):192-205+208.
  • [iv]如果某一事件每次發(fā)生狀態(tài)轉(zhuǎn)移時,都只與上一時刻的狀態(tài)有關(guān),而與過去的狀態(tài)無關(guān),則稱此狀態(tài)轉(zhuǎn)移過程為馬爾可夫過程。

歡迎關(guān)注「網(wǎng)易UEDC」公眾號:

如何調(diào)研小眾人群?來看網(wǎng)易設(shè)計(jì)師的有效方法!

收藏 21
點(diǎn)贊 7

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場,未經(jīng)允許不得轉(zhuǎn)載。