<abbr id="8ggge"></abbr>
<kbd id="8ggge"><code id="8ggge"></code></kbd>
<pre id="8ggge"></pre>
  • <s id="8ggge"><dd id="8ggge"></dd></s>
    <s id="8ggge"><dd id="8ggge"></dd></s><cite id="8ggge"><tbody id="8ggge"></tbody></cite>
    <kbd id="8ggge"><code id="8ggge"></code></kbd>

    國內或國外 期刊或論文

    您當前的位置:發表學術論文網經濟論文》 隱馬爾可夫模型估計的新方法及應用案例> 正文

    隱馬爾可夫模型估計的新方法及應用案例

    所屬分類:經濟論文 閱讀次 時間:2020-09-29 10:11

    本文摘要:內容提要 隱馬爾可夫模型廣泛應用于經濟、金融及大數據領域。 目前,模型估計的主要 方法是基于極大似然估計的 Viterbi 算法。 本文從隨機過程的常返理論出發,給出了隱馬爾可夫模型參數估計的新方法。 首先,利用從同一狀態的觀察值出發到固定點的首中時有

      內容提要 隱馬爾可夫模型廣泛應用于經濟、金融及大數據領域。 目前,模型估計的主要 方法是基于極大似然估計的 Viterbi 算法。 本文從隨機過程的常返理論出發,給出了隱馬爾可夫模型參數估計的新方法。 首先,利用從同一狀態的觀察值出發到固定點的首中時有相同分 布的原理,給出隱狀態個數的估計;再根據首中時數學期望與平穩分布的關系得到平穩分布和發射概率的估計;最后以上述方法為基礎,完成了隱馬爾可夫模型的兩個應用研究:構建個性化推薦系統;揭示我國經濟周期不同階段間的轉換規律。 本文提出的新估計方法可以大幅減少計算復雜度,是 Viterbi 算法的有益補充。

      關鍵詞 隱馬爾可夫模型 推薦系統 經濟周期

    統計研究

      一、引言

      隱馬爾可夫模型是混合模型的推廣(Bickel et al.,1998), 金融領域則常稱之為馬爾可夫區制轉 換模型;它是迄今為止應用最為廣泛的統計模型, 尤其在語音識別(Rabiner,1989)、人臉識別(Shang & Chan,2009)、圖像處理等大數據領域(Aghdam, 2019)。

      經濟論文投稿刊物:《統計研究》(月刊)是由中國統計學會;國家統計局統計科學研究所主辦的統計科學刊物。本刊在廣大作者、讀者的關心支持下,逐漸形成了自己的辦刊特色,成為統計領域最具權威性的理論刊物。

      最近,經濟領域的建模分析也大量應用了 隱馬爾可夫模型(李正輝、鄭玉航,2015)。 有限狀態的隱馬爾可夫模型可以理解成裝有 不同顏色球的一組罐子(Jeff,2006)。 每次抽樣時 按初始分布選擇第一個罐子,并從中取出一球;在 第一次罐子的基礎上選取第二個罐子, 第二次選 取的罐子只與前一次選的罐子有關, 在第二個罐子里取出第二個球,如此繼續。 通常,罐子是看不 到的,所有的統計推斷只能通過觀察值(選取的球 序列)完成。

      本文將在隱狀態個數 (罐子數) 未知的條件 下,通過可觀測變量序列,研究隱馬爾可夫模型的 參數或非參數估計方法, 即從觀察序列出發估計 模型的參數或分布(學習問題)。 眾多學者對這一 問題做了大量研究 (劉鶴飛等,2017)。 Douc & Moulines(2012)證明了隱馬爾可夫模型參數的極 大似然估計是強相合的, 但在隱狀態數未知的條 件下,似然函數較難有顯式表達。

      De Castro et al. (2016)、Gassiat & Rousseau(2014)利用貝葉斯方 法對隱馬爾可夫模型進行估計, 但這一方法在利 用對數似然比時加了一項懲罰函數, 且模型估計的效果嚴重依賴懲罰函數的選擇。 本文從馬爾可 夫過程的常返理論出發給出了隱馬爾可夫模型的 所有參數估計。 實際應用中,Viterbi 算法是隱馬爾 可夫模型的基本算法, 它的統計原理是極大似然 估計, 算法設計中基于向前向后步優化的 EM 準 則,逐步擬合模型參數;但這一算法也繼承了 EM 算法的缺陷:耗時巨大,且估計的參數可能是局部 最優的。

      本文給出的新估計方法的優點是準確率高, 計算復雜度低。 常規的 Viterbi 算法隨機選擇隱狀 態個數,然后進行轉移矩陣的合并或分解,最后對 各參數進行極大似然估計, 要達到理想的收斂值 通常要進行上萬次的迭代(樓振凱,2019),相比之 下,我們的方法目標明確,算法簡捷。 本文的另一貢獻是給出了基于新估計方法的 個性化推薦系統。 推薦系統常用來幫助使用者在 眾多產品中盡快發現其感興趣的目標, 它在各網 絡平臺大量使用,如 Google.com,Amazon.com 和我 國的百度、阿里巴巴等。 針對不同對象的個性化推 薦系統更是重點建設對象,Google 和百度近年來 在這方面取得了長足進步, 但準確度更高的個性 化推薦系統一直在建設中。

      本文將用戶以往信息 視為一隱馬爾可夫鏈, 基于此構建用戶的個性化 推薦系統。 在 Grouplens Reach 數據集上的實驗表 明,本文方法的推薦準確率優于其他推薦算法。 實證分析部分根據 GDP 增長率數據,分析了 我國的經濟運行周期。 經濟周期理論由來已久,不 同周期的劃分、 識別和監測是經濟周期理論研究 的一個核心問題; 經濟變量通常表現出不穩定性 及非線性關系, 識別和監測經濟周期的波動主要 采用的是隱馬爾可夫模型 (馬爾可夫區制轉換模 型)。

      傳統的經濟周期理論將經濟周期劃分為經濟 的擴張階段和收縮階段(二區制),在經濟運行中 兩者交替循環,從而形成一定的波動規律。 部分國 外學者將經濟周期分為三區制或四區制; 國內學 者在研究我國的經濟波動規律時, 通常人為設定 為二區制或三區制。 本文認為,經濟周期的區制劃 分應充分考慮各個國家的不同特點, 由具體的經 濟數據決定。 我們將利用隱馬爾可夫模型及估計 新方法, 確定我國自 2000 年第一季度至 2019 年 第四季度經濟周期的變化及經濟周期不同階段間 的轉換概率。

      二、模型描述

      隱 馬 爾 可 夫 模 型 是 一 個 雙 變 量 隨 機 過 程 {(Xn,Yn),n≥1},其中{Xn,n≥1}是有限狀態的馬 爾可夫鏈;對給定的 Xn,Yn 關于其他變量獨立。 通 常,馬爾可夫鏈是隱藏不見的,觀察值是 Yn 序列。 以下給定一些記號及假設, 設馬爾可夫鏈 {Xn,n≥1}的狀態空間為 S={x1,x2 ... xS},轉移概率 矩陣為 As×s。 本文有三個假設。 假設 1:馬爾可夫鏈{Xn,n≥1}是遍歷的。

      因為狀態空間有限,這一條件并不嚴苛,幾乎 所有研究隱馬爾可夫模型理論性質及統計推斷的 文章都有此要求, 滿足這一要求的馬爾可夫鏈是 正常返,且有唯一的平穩分布。 假設 2:馬爾可夫鏈{Xn,n≥1}的初始分布為 其平穩分布。 實際應用中并不要求隱馬爾可夫模型有平穩 的初始分布,因為對一個常返的馬爾可夫鏈,經歷 一段時間后即可平穩, 所以通常的做法是去除前 若干個觀察值,即能達到要求。

      設給定 Xn=xk 時,Yn 的分布 μk 通常被稱為發 射概率。 本文對 Yn 變量的分布類型不做限制,可 以是離散的,也可以連續,但具有如下假設: 假設 3:每個 μk 的取值范圍不相重疊。 在隱狀態個數的估計中, 只要求每個狀態下 的觀察值不完全重疊即可, 為了其他參數的估計 更方便,表達更簡潔,我們增強了假設 3。

      下面給 出一個隱馬爾可夫模型的常用例子。 例(正態分布的混合)假設隱狀態個數為 2,A 是不同狀態之間的轉移概率矩陣,兩個隱狀態所對 應的發射變量分別服從 N(μ(1),σ2 )和 N(μ(2),σ2 ) 的正態分布。此時,Yn 是具有不同期望但同方差的 二個正態分布的混合; 在經濟領域則是生成機制 為 Yn=μ(k)+σεi 的馬爾可夫區制轉換模型,其中 εi 為白噪聲。 這一模型也常用于模擬受噪音干擾 的信號傳輸系統。

      三、隱狀態個數的估計

      馬爾可夫鏈{Xn,n≥1}的狀態空間為 S={x1,x2 ... xS},s 即為隱狀態個數,或稱之為隱馬爾可夫模 型的階。 我們分兩種情況討論,首先假設觀察值空 間有限,設其為 O={o1,o2 ... om}。 {y1,y2 ... yn}是來自隱馬爾可夫模型 {(Xn,Yn),n≥1} 的一個觀察序 列,令 τij 為 Yn 從 oi 出發到 oj 的首中時,即 τij=inf{t>0,Y0=oi,Yt=oj}。 令 τ=(τij)m×m 及 Eτ=(Eτij)m×m 分別為首中時矩陣及 其期望。 如果 oi 和 oj 來自同一個罐子,則對任意的 ok,τik 和 τjk 同分布,故有 Eτik=Eτjk。

      對一個足夠長的觀察 序列,因為常返性,可以得到獨立同分布的首中時 序列{τ n ik, n≥1}和{τ n jk, n≥1},分別用它們的均值 代替數學期望,得到矩陣 τ=(τij)m×m,通過對(τij)m×m 的 行或列的聚類即可獲得 HMM{(Xn,Yn),n≥1}的階 的估計s贊 。 按 Zheng 等(2019),s贊是 s 的強相合估計 量。 觀察值也同時聚為s贊 類,分別為{y11,y12...y1n1 }... {ys 贊 1,ys 贊 2...ys 贊 n1 }類,且對應的狀態序列估計也同步完成。 現在考慮發射變量為連續分布的情形,此時觀 察值仍為{y1,y2 ...yn},但若 μk 為連續型分布函數時, τij 可能是無窮大,此時,我們將觀察值分成若干個 小區間(高維時則分成區塊),令其分別為 A1,A2... An,按上面步驟,仍可完成對返回時的聚類,以獲得 階的估計值s贊及觀察值對應的狀態序列。

      上述聚類估計的原理是同一類的觀察值到某 一固定觀察值的首中時是同分布的, 因而具有相 同的數學期望, 然后用首中時的樣本均值代替其 數學期望進行聚類。 根據中心極限定理,聚類的閾 值為 n-1/2 的常數倍,其中的 n 是樣本容量。 實際使 用中,我們選取歐氏距離作為距離函數,閾值為 3 倍樣本均方差。 這種方法的好處是適用于高維發射分布的隱 馬爾可夫模型,因為是按行聚類,只要求每個狀態 的觀察值不完全相同即可;同時計算復雜度低,便 于計算機操作,是常用 Viterbi 算法的重要補充。

      四、其他參數的估計

      當觀察空間離散時, 由馬爾可夫過程常返理 論知,平均返回時間是平穩分布的倒數,據此可以 估計平穩分布。 當觀察空間連續時,我們仍可按上 述同樣方法得到平穩分布的估計值, 但發射分布 的估計要改為核密度估計。

      五、數值模擬

      本文首先根據隱馬爾可夫模型的定義生成一 個觀測數據集, 然后按照上述方法獲得隱狀態個 數,初始分布,轉移概率及發射概率的估計,以驗 證上述估計量的有效性。 所有試驗環境為配備 core i5 和 8 GB RAM 的 windows 7 PC 機。

      六、基于新估計方法的網絡推薦系統

      根據用戶以往信息, 打造個性化推薦系統 (Aghdam,2019) 是各大網絡平臺努力建設的重要 目標。 國際最大的在線電影租賃公司 Netflix 不定 期地主辦國際推薦系統大賽,推薦系統的準確率每 提高 1%,都將獲得豐厚獎金。阿里巴巴公司也設計 了類似的“金阿里”競賽。Google 公司推薦系統深受全球好評, 近期百度的推薦系統也取得了長足進 步。 本文基于隱馬爾可夫模型建立個性化推薦系 統,并根據實證結果再次驗證本文估計的效果。

      (一)數據來源 因為 Netflix 數據集無法獲取,我們選取Grouplens Reach 數據集建立電影推薦系統。Grouplens Reach 包括 17770 部電影和 480189 個用戶的相 關數據,其中包括用戶基本信息,用戶每次觀看電 影的類型,電影名,觀看時間以及對所看電影的打 分。 我們利用 Grouplens Reach 數據集,驗證上文 方法的有效性。

      (二)模型建立 本文選取數據集中觀看電影數超過 2000 部的 用戶 44 名, 將每個用戶觀看的電影類型作為觀測 序列,觀測集包括喜劇、恐怖片、動作片、浪漫劇、冒 險片等 18 種電影類型。 利用上文方法首先就每個 用戶構建隱馬爾可夫模型:觀察值為該用戶的觀看 電影類型,由此估計隱馬爾可夫模型的的隱狀態個 數,此時的隱狀態個數可理解為用戶的電影選擇偏 好(喜歡、不喜歡等);進而各狀態之間的轉移概率 和具體某個類型的觀測值對應的發射概率;最后根 據概率最大的原則給出推薦的電影類型。

      七、基于隱馬爾科夫模型對經濟周期的實證分析

      經濟周期由經濟數據的波峰、 波谷和運行時 間確定,在經濟學中有嚴格的定義;但對經濟周期 不同階段(即隱狀態個數,也稱為區制)的劃分則 有較大的主觀性,有二區制說、三區制說和四區制 說。 經濟周期研究中,由于區制數難以估計,通常 預先假定,然后通過某個準則進行模型選擇;但事 實上,區制個數是模型的決定性參數,它直接決定 模型的結構和其他參數的構成, 因而影響模型的 擬合效果和預測的準確率。

      本文認為區制個數應 該由經濟數據本身的結構決定。 GDP 是國家經濟狀況的直接反映, 本文選取 GDP 作為經濟運行指標, 構建發射分布為高斯分 布的隱馬爾可夫模型, 其中的隱狀態對應的是不 同的經濟區制, 而隱狀態之間的轉移概率即為不 同區制間相互轉換的可能性。 數據的預處理方法 為:根據實際 GDP 數據,計算出它們的同比增長 率。 樣本區間為 2000 年 1 季度至 2019 年 4 季度, 數據來源于銳思金融數據庫。

      八、結論

      本文研究了隱馬爾可夫模型的參數估計及應用。 首先利用常返理論給出了隱狀態個數的估計, 在此基礎上進一步估計了平穩分布和發射概率, 進而利用加權極大似然估計得到轉移概率的估計。 數據模擬的結果表明新方法能有效識別隱馬 爾可夫模型的結構。 隱馬爾可夫模型識別中, 隱狀態個數的估計 是模型可識別的標志, 也是其他參數準確估計的前提。 我們提出了一種新的隱狀態估計方法,不同于現在流行的 Viterbi 算法, 我們的方法目標明確,算法簡捷。 在其他參數的估計中,我們要求模型每個狀態的發射變量取值不相重疊, 這一條件過于嚴苛, 建議在本文隱狀態個數估計的基礎上 結合 MCMC 方法估計其他參數,這將大大提高模 型適用范圍,同時降低計算成本。

      數值模擬的結果表明:針對不同的發射變量, 本文方法均能準確估計隱狀態個數, 平穩分布的 估計也較為穩健;發射變量為連續分布時,發射變 量的密度估計還有待提高。 我們基于 Grouplens Reach 數據集構造了個 性化的電影推薦系統,與其他系統相比,隱馬爾可 夫模型的準確率最為突出;同為隱馬爾可夫模型, 本文構造的估計方法優于現有算法。 實例應用中,本文對我國的 GDP 實時數據增 長率建立隱馬爾可夫模型,分析了2000 年第一季度至 2019 年第四季 度期間內我國經濟周期區制個數及其相互轉化的 概率。 實證結果表明:此時間段我國經濟周期呈現 兩區制,且經濟運行較為平穩,區制間的轉換概率 較小。

      參考文獻:

      1. 李正輝、鄭玉航:《基于混頻數據模型的中國經濟周 期區制監測研究》,《統計研究》2015 年第 1 期。

      2. 劉鶴飛、王坤、蔣成飛:《隱狀態個數未知的隱馬爾 可夫多元正態分布的貝葉斯推斷》,《統計研究》2017 年第 12 期。

      3. 樓振凱,侯福均,樓旭明:《部分狀態可見的隱馬爾可 夫模型狀態序列的估計方法》,《統計研究》2019 年第 6 期。

      4. Bickel P.J., Yacov R., Tobias R. Asymptotic Normality of the Maximum-likelihood Estimator for General Hidden Markov Models. The Annals of Statistics, 1998, 26(4): 1614~1635. 5. Rabiner L.R. A Tutorial on Hidden Markov Models and Selected Applications in Speech. Recognition. IEEE, 1989, 77.

      作者:朱 斌 鄭 靜

    轉載請注明來自發表學術論文網:http://www.zpfmc.com/jjlw/24387.html

    主站蜘蛛池模板: 天天躁夜夜躁狠狠躁2021| 免费人成视频在线| 亚洲综合无码一区二区三区| 全彩里番acg里番| 九九电影院理论片| a级毛片高清免费视频就| 麻豆md国产在线观看| 嘿嘿嘿视频免费网站在线观看 | 窝窝视频成人影院午夜在线| 最新国产精品精品视频| 在线|一区二区三区四区| 向日葵app在线观看下载大全视频 向日葵app在线观看下载视频免费 | 中文字幕julia中文字幕| 日本成本人视频| 欧美黑寡妇黑粗硬一级在线视频| 无码av无码天堂资源网| 国产欧美久久久精品影院| 亚洲精品无码不卡| 一本大道AV伊人久久综合| 色综合热无码热国产| 最近最新中文字幕完整版免费高清| 在线精品一区二区三区电影| 免费精品国产日韩热久久| 9久久免费国产精品特黄| 精品无码一区二区三区亚洲桃色 | 日韩美女视频网站| 国产精品成人99一区无码| 人妻少妇精品视频一区二区三区 | 精品国产成人亚洲午夜福利| 女人张开腿让男人捅爽| 国产乱理伦片在线看夜| 亚洲av无码一区二区三区天堂古代| 9999国产精品欧美久久久久久| 精品久久久久久久免费人妻| 搡女人免费免费视频观看| 国产亚洲美女精品久久久2020| 久久精品无码精品免费专区| 性色爽爱性色爽爱网站| 欧美人与动性xxxxx杂性| 国产精品第7页| 亚洲成av人片在线观看无码|