本文摘要:摘要:【目的/意義】在線健康社區已成為公眾獲取醫療信息和服務的重要形式。識別在線健康社區關鍵用戶及其特征,為提升健康社區服務質量和效率提供理論依據!痉椒/過程】基于信息行為學理論構建了包括交互行為屬性、信息質量屬性、情感傾向屬性的多維分析框架,利用A
摘要:【目的/意義】在線健康社區已成為公眾獲取醫療信息和服務的重要形式。識別在線健康社區關鍵用戶及其特征,為提升健康社區服務質量和效率提供理論依據!痉椒/過程】基于信息行為學理論構建了包括交互行為屬性、信息質量屬性、情感傾向屬性的多維分析框架,利用AttriRank算法和網絡抗毀性評估方法識別在線健康社區關鍵用戶!窘Y果/結論】在膽系癌癥疾病QQ群中識別出15個關鍵用戶。他們不僅具有高活躍性和高互惠度的交互行為特征,還具備多樣性水平高且結構均衡的信息質量特征,且多數持有正向情緒傾向。“行為+內容+情緒”的分析框架和考慮屬性的用戶排序算法能準確識別在線健康社區關鍵用戶,為在線健康社區的持續運營供了科學的決策支持。【創新/局限】構建多維屬性分析框架進行在線健康社區關鍵用戶識別,豐富了在線健康社區關鍵用戶識別的理論體系。
關鍵詞:在線健康社區;關鍵用戶;屬性融合;AttriRank算法;網絡抗毀性評估
1引言
隨著“互聯網+醫療”及“健康中國2030”戰略導向的發展,公民健康意識與信息素養正不斷提升,促進了一系列在線健康社區的形成與快速發展,如甜蜜家園、百度高血壓吧和以醫療健康為主題的QQ群、微信群等【1】。中國互聯網信息中心發布截至2020年12月,在線醫療用戶規模達2.15億,占網民整體的21.7%,新冠肺炎疫情期間部分第三方互聯網服務平臺咨詢量同比增長了20多倍【2】。
在線健康社區已逐漸成為了患者獲取健康信息的重要渠道。病患及家屬借助不同類型的在線健康社區平臺與病友、醫生、志愿者等進行交互,搜尋醫生醫院、治療方案等信息。他們共同構成了在線健康社區,并在交互過程中不斷學習和積累經驗,實現了健康信息搜尋、交互、獲取方式的進化。
研究結果顯示,與知乎問答社區、Linux在線交流社區及Wiki編輯者社區等在線社區一樣【3】,在線健康社區中也存在一類特殊用戶【4】,對其存在和發展起到了重要的作用。他們通過積極提供健康知識、開展情感交流,帶動新用戶、潛伏用戶積極參與在線活動【5】,是社區存在和發展的重要驅動力,被稱為在線健康社區中的關鍵用戶。由此,構建多維屬性融合的在線健康社區關鍵用戶識別方法并分析他們的行為特征,對提高在線健康社區的管理水平和服務質量有重要的參考價值。
2相關研究現狀述評
在線社區上的關鍵用戶可能是輿情傳播中的“意見領袖”,也可能是某個特殊領域的自媒體。他們往往有大量的粉絲或關注者,由其提供的信息會有較大的概率被轉發和評論【6】,進而能影響更多的普通大眾。所以已有研究成果主要考慮了關鍵用戶在社會網絡中的結構位置進行識別,如:在線社會網絡中節點的度數、介數、特征向量中心性等【7-9】,其優勢是評價方法比較客觀,但是評價指標比較單一。而在線健康社區(OnlineHealthCommunity)是一類特殊的知識型在線社區,醫生、患者及其家屬都可以在不受時間和空間條件的約束下,用發文、回復、點贊、轉發等形式完成健康信息或者專業醫療知識交互【10】。
因此,在線健康社區上的關鍵用戶不僅在社會網絡中位置重要,還能提供醫療領域知識并促進用戶之間的交流【11】。所以從信息行為學視角出發,識別在線健康社區中的關鍵用戶需要綜合考慮用戶的交互行為、內容和主題、甚至情感等多個維度【12-13】。在線健康社區用戶行為研究涉及了用戶搜索行為、分享行為和交互行為等方面。早期的用戶行為研究通過調研和統計分析方法,解釋了用戶的健康信息行為動機,認為利他主義、享受、自我價值等滿足感會對用戶的醫療知識共享行為產生顯著正向影響【14-16】。
隨著在線健康社區應用的普及,研究熱點遷移到用戶的交互行為。劉璇等【5】研究了在線健康社區用戶的回帖行為,發現活躍度比較高的用戶在后續交互中獲得回復的概率比較大。這說明了高活躍度用戶是在線健康社區交互關系產生的動力【17】。
此外,從社會互惠理論視角來看,在線健康社區的用戶在利他心理的驅動下,通過交互行為能夠實現信息價值資源的交互,比如:疾病治療的專業建議和情感支持。用戶所持有的互惠交互模式也是維持在線社區運營的重要社會性規范之一【4】。
健康信息內容也是在線健康社區研究的一個重要分支。學者們主要采用文本挖掘、機器學習等方法對健康信息內容或主題分布進行識別、分類、統計等分析【18-21】,并關注到較差的信息質量【22】不僅會影響用戶參與社區交互行為的發生,還會直接導致社區用戶流失。由于在線健康社區是一種典型的UGC社區,用戶是提供知識和信息的主要來源,故而用戶所持有的信息質量高低就決定了在線健康社區專業領域知識服務的水平。
一般而言,評價一個用戶信息質量可以從信息內容多樣性和信息結構均衡性兩個方面出發。如:范昊等【23】研究發現在YahooAnswers社區中,有些關鍵節點雖然度比較大,但其貢獻的內容比較單調,使得社區交互結構比較松散;翟羽佳等【24】研究則表明,百度戒煙吧由于中高活躍用戶貢獻的信息不均衡,導致論壇話語權偏移,阻礙了新用戶的參與。因此,信息質量是識別在線健康社區中關鍵用戶不可或缺的維度。
此外,在對用戶的信息需求進行研究時發現,在線健康社區上的患者及家屬不僅需要專業知識的支持,情感支持和陪伴【25】等也十分重要。Beaudoin等【26】通過研究在線健康社區中的情感支持對癌癥病人情緒的影響,發現在線健康社區確實能夠減少癌癥病人的負向情感。同時,患者之間的交互行為可以將用戶的負向情感逐漸轉變為正向情感,表明在線健康社區可以給患者及家屬提供必要的情感支持【27】。
因此,對于在線健康社區來說,用戶情感屬性也是關鍵用戶識別的重要維度。綜上所述,目前對在線健康社區的關鍵用戶識別研究還較少,需要從“行為+內容+情緒”等多維度綜合考慮開展研究。鑒于此,本文從信息行為學角度出發,構建了交互行為屬性、信息質量屬性和情感傾向屬性指標;然后基于Attri⁃Rank算法和網絡抗毀性評估方法進行關鍵用戶的識別和檢驗,并分析了關鍵用戶的基本特征。
3研究設計
3.1關鍵用戶識別和分析框架
本文設計了在線健康社區關鍵用戶識別和分析框架。根據信息行為學理論,提出“行為+內容+情感”的多維度分析框架,構建用戶交互行為屬性、信息質量屬性、情感傾向屬性。其次,根據在線健康社區用戶交互行為數據,構建用戶交互網絡并計算用戶交互行為屬性;根據在線健康社區用戶的信息內容數據,結合百度名醫百科文本內容及醫學詞典生成用戶交互關鍵詞,用pkuseg切詞工具和LDA主題技術識別并抽取在線健康社區的主題,并用基于詞典的情感極性分析方法分析用戶情感屬性。然后,基于AttriRank算法對用戶進行評分和排序,通過網絡抗毀性評估和檢驗社區內的關鍵用戶效用,并分析關鍵用戶的屬性特征。
3.2用戶屬性
在線健康社區中的用戶可以通過提問、回答、評論等在網絡上進行交互。以用戶作為節點,用戶之間的交互關系作為連邊,兩者構成了一個復雜的交互網絡,可以記為G=(V,E)。其中V是交互網絡中的節點集合,且V中的每個節點i均具有交互行為屬性、信息質量屬性和情感傾向屬性。E是用戶交互關系構成的有向邊集合,∀e ∈E,表示節點i提及(@)、轉發或者評論節點j的信息,即節點i主動與j進行交互。
3.3關鍵用戶識別方法
3.3.1AttriRank算法
AttriRank是同時考慮網絡結構和網絡中節點屬性的無監督節點重要性排序方法【29】。該算法以PageRank算法為基礎,同時考慮節點的多維度屬性,對網絡中的每個節點進行打分。
4實例及分析
4.1數據集簡介
本文選擇了肝膽外科中膽系癌癥QQ群社區為研究對象,它是國內較大、人數較多、交流較為活躍自發病友群,共包含2780個用戶,涉及30個省市(臺灣、西藏、香港和澳門除外)。本文收集了社區內2020.07.01-2020.12.31共6個月的聊天文本,共獲取197649條有效數據。由于膽系癌癥發病率低且惡性程度高,患者和家屬對此病癥知識了解途徑比較少,所以在QQ群社區中,用戶間交互比較頻繁。
一般而言,用戶可以根據社區中的上下文隨意加入到聊天列表中。另外一種方式是用戶通過@提及某個特殊用戶,進行提問或者回答等交互。由此,將QQ群社區中用戶作為交互網絡的節點,根據第二種交互方式生成有向邊添加到交互網絡。最終該健康社區的交互網絡由2780個節點和11000條有向邊組成,過濾掉孤立節點后得到社區最大連通分量圖。
節點的大小與該節點度的大小相對應。交互網絡結構統計結果為:節點平均度為3.957,即每個用戶會與3至4個人發生交互;模塊度為0.173,說明用戶交互中形成了明顯的社區結構;平均路徑長度為2.698,聚類系數為0.17,兩者表明該交互中存在較短的信息傳輸路徑,可以使健康信息在社區中快速傳播。此外,根據在線健康社區用戶的聊天內容數據,結合百度名醫百科文本內容及醫學詞典生成用戶交互關鍵詞集合KW,包含關鍵詞89516個;用pkuseg切詞工具與LDA主題技術結合,識別并抽取在線健康社區的主題集合Γ,共包含6個主題。
在雙對數坐標系下,多樣性值較小的用戶均質性值比較分散,多樣性值偏大的用戶均質性接近1。也就是對于普通用戶而言,受到自身知識背景、病程、病癥等因素影響,他們聊天內容涉及的信息量和主題范圍有較大的局限性。而關鍵用戶則是要給不同病程和病癥的患者和家屬提供健康醫療知識,所以其信息多樣性和均質性值均名列前茅。
有70.1%用戶的情感傾向度值低于m-,29.9%的用戶情感傾向度值高于m-。其中,關鍵用戶的情感傾向度均處于較高的水平:情感傾向度的最小值是0.64476,是均值的1.5142倍,情感傾向度的最大值是2.51826,是均值的5.91418倍。此外,關鍵用戶情感傾向度主要集中在1附近,表明關鍵用戶在交互過程中傾向于表達正向情感,且沒有明顯的極端性,這對于維持良好的社區氛圍起到了重要的作用。
5結語
本文研究在線健康社區關鍵用戶識別和特征分析問題。首先為關鍵用戶的識別構建出多維融合屬性指標體系,從交互行為屬性、信息質量屬性和情感傾向屬性三個維度,構建了用戶的活躍度、互惠度,信息的多樣性、均質性,情感傾向 度等5個分析指標。其次是構建關鍵用戶識別方法,諸如PageRank等經典的關鍵用戶識別算法不適用于在線健康社區,應結合用戶多維屬性開展在線健康社區關鍵用戶識別和特征分析。
因此本文在AttriRank算法基礎上獲取用戶評價結果和排名,通過網絡抗毀性評估方法識別在線健康社區關鍵用戶。本文以膽系癌癥的患者和家屬自發形成的QQ群社區為研究對象開展了實證驗證,在膽系癌癥QQ群社區中識別出15個關鍵用戶。
研究結果表明:第一,在線健康社區中的關鍵用戶比普通用戶有較高的交互意愿,他們的作用不僅體現在與普通用戶發生交互,而且還是社區中健康信息和醫療知識的主要傳播者;第二,在線健康社區中的關鍵用戶不僅比普通用戶擁有更多信息,而且信息結構更均衡,是社區中主要的知識和經驗來源及載體;第三,在線健康社區中的關鍵用戶極少有極端情緒表現,能給普通用戶提供適度的正向情感支持。在未來的工作中,可結合時間感知框架設計動態環境下的關鍵用戶識別算法,進一步提高健康信息服務水平,為促進社區發展提供更多的合理建議。
參考文獻
1趙棟祥.國內在線健康社區研究現狀綜述[J].圖書情報工作,2018,62(9):134-142.
2中國互聯網絡信息中心.第47次中國互聯網絡發展狀況統計報告[EB/OL].[2021-02-03].
3柯陽,隋杰.基于用戶特征屬性的微博話題關鍵用戶挖掘[J].計算機應用研究,2019,36(6):1614-1617,1622.
4吳江,周露莎.在線醫療社區中知識共享網絡及知識互動行為研究[J].情報科學,2017,35(3):144-151.
5劉璇,汪林威,李嘉,張朋柱.在線健康社區中用戶回帖行為影響機理研究[J].管理科學,2017,30(1):62-72.
6席海濤,聶文博,李閨臣,田慧敏,陳立.在線健康社區用戶交互的研究現狀與進展[J].情報科學,2021,39(4):186-193.
7FREEMANLC.Asetofmeasuresofcentralitybasedonbetweenness[J].Sociometry,1977,40(1):35-41.
8FREEMANLC.Centralityinsocialnetworksconcep⁃tualclassification[J].SocialNetworks,1978,1(3):215-239.
作者:張軍,李新旺,李鵬
轉載請注明來自發表學術論文網:http://www.zpfmc.com/jjlw/29626.html