本文摘要:隨著近年來,人們對統計學知識研究的不斷深入,統計學方法被不斷應用在各個學科的發展中,其中以經濟學和生物醫學表現尤為明顯。
問:統計學畢業論文可以寫什么內容?
答:統計學畢業論文的寫作方向有很多,作者可以根據自己擅長的方向入手,也可以通過參考其他發表統計論文寫作方向,例如統計體制視角下的統計數據質量理論研究,企業統計創新、統計思想芻議、統計過程和統計觀念等等。
隨著近年來,人們對統計學知識研究的不斷深入,統計學方法被不斷應用在各個學科的發展中,其中以經濟學和生物醫學表現尤為明顯。選取正確的統計學方法幫助醫學實驗推導結果,是目前醫學科研發展的一項重要的工作。是否選取正確的統計方法將直接對醫學科研發展中的的嚴謹性造成影響,方法選取正確可能帶來較高價值的醫學結果,而選取不當則會使得其反,甚至得出與事實嚴重相悖的結論。但是,并不是所有的醫學工作者都對這一觀點有著較高的認知水平,在實際工作中,忽視統計學知識的重要性和科學性的實例層出不窮,某些研究人員濫用統計學方法,甚至未經科學驗證就在文章里敘述“采用某檢驗的統計方法進行分析”,這些都造成了目前醫學實驗中統計方法應用較為混亂的問題。甚至存在,某些醫學文獻中盲目參考前人統計學資料和結論,沒有深入理解,得出讓人啼笑皆非的結論。本文從醫學實驗中常見的幾個統計學錯誤:統計學表達描述出現問題、使用單因素方法考慮多因素問題、盲目套用統計分析模式以及不考慮統計推斷方法使用的前提條件出發,討論錯誤的成因,并就如何避免此類錯誤給出一點建議和對策[1]-[3]。
一、統計學表達和描述方式存在錯誤
在對醫學實驗的分析中,往往不可避免的要對所收集的眾多數據進行某種意義的表達和描述,盡管常見的表達和描述方法所有人都會,看似這是一件很容易的事情。但是,一旦應用到統計學的知識,很多人就會不可避免的犯各類錯誤。常見的表達和描述錯誤有以下幾個方面:第一,在統計表方面,表中紛繁的數據并沒有給出一個合適的表達對其進行描述,容易使人造成誤解;第二,在統計圖方面,刻度值是極其容易出現錯誤的一種情況,此外,錯誤使用不能表現所需表達性質的圖表的情況也較為常見;第三,在定性資料和定量資料的分析過程中出現表達錯誤;第四,在對定量資料進行描述的時候,不考慮其是否偏離正態分布,,不考慮標準差與平均值的關系,一味的使用x±s表達等等。
以某篇醫學文章中的應用為例,展開討論:在該論文中,用下表描述定量資料。
表1 兩類奶牛乳蛋白含量比較(%)(x+s)
按照表中數據描述,是應用平均數以及標準差來有效的描述資料的,看似科學并且有理有據,但是經過與下表2的對比分析,卻會發現,如下情況:
表2 兩類奶牛乳蛋白含量比較(%)(x+s)
表中存在標準差大于平均值的情況,顯然可以判斷數據不符合正態分布的規律性,此時若繼續按照之前的方式描述數據,就會產生錯誤。相反,如果此時將標準差變為變異指標,從而有效表達資料情況就相對比較合理,而且更有利于過程中問題的發現。
二、盲目使用單因素統計思想考慮多因素問題
這一問題多出現在列聯表的相關資料和問題當中,在這類問題中,可能對結果變量造成影響的因素并不是單一的,并且和可能各因素之間也存在交叉的作用。在這種情況下,如果盲目采取化繁為簡的方式,將所需要的資料化簡成最簡單的二維列聯表的形式,進而采取最為常見的卡方檢驗對數據進行分析,就可能造成錯誤。在筆者剛接觸此類醫學實驗的時候,通常假定各因素具有獨立性,在這一前提下,上述方法是合適的,但是,如果沒有這一前提存在,各因素之間存在或淺或深的相互聯系,就將會得出錯誤的結論。例如在某一篇醫學論文中,作者寫作的本意是分析不同年齡段、性別以及身體狀況的人對某一病毒抵抗力的差異,然后分別針對三個因素各自整理一個列聯表并進行卡方檢驗,然后開始數據統計分析的工作,并得出自認為比較滿意的結論。但是仔細推敲,其實三個因素的獨立性并沒有得到正確的驗證,這樣盲目的分離數據的措施是相當不具有科學性和合理性的,統計分析的結論也可以說是完全沒有說服力的結論。當然,從統計學角度來說,我們也并不能完全否定上述結論,只能說上述結論也是具有一定的參考價值的,正確的做法應該是:采用logistics回歸模型進一步對相關因素進行篩選,取代單一的卡方檢驗方式。
三、盲目套用統計分析的模式卻并沒有實質性的分析
發展到現在,統計方法已經拓展的多種多樣,比較常用的有卡方檢驗、t檢驗、因子分析、方差分析、回歸分析等等,每一種統計方法都有其對應的特殊意義。有一些統計方法的作用只是單純的為了判斷某兩種因素是否存在關聯性,有一些方法則是用來比較兩組數據是否存在較為明顯的線性趨勢,此外還有一些統計方法可能只是為了篩選出影響數據結果的最重要因素……很多醫學論文中甚至沒有搞懂不同統計方法的基本區別,就盲目套用統計分析的模式進行分析,不重結果只求分析過程的花樣性,這完全喪失了統計學方法在醫學實驗中應用的意義。例如,在某醫學實驗的相關論文中,作者希望分析老年人的最大呼氣流量與工作能力的關系,最終卻選用了卡方檢驗的方式,得出二者之間間是否具有獨立性的結論,完全與作者本意無關,既不能得出有效結論,還造成了論文表述的繁瑣冗長,一定程度上還增加了作者的工作量。此時正確的想法應當是檢驗上述二者是否具有一致性的關系,所以采取比較常見的一致性檢驗措施更為有效和必要,例如在這篇文章中就可以采用Kappa檢驗,隨之也將取得更為理想的結果。
四、忽視統計方法使用的前提
通常情況下,統計方法的應用都應當是考慮其適用的前提條件,例如在我們比較常用的一些統計方法應用在醫學實驗的實例中的情況,都是先考慮其前提條件是否適合,再進一步進行統計推斷的:t檢驗就是最為常見的例子,采取t檢驗進行統計分析前,必須保證所參與比較的兩組數據是服從正態分布的,此外方差齊性也是必須要滿足的條件之一。如果不能夠滿足統計方法使用的前提條件而盲目應用統計推斷的方法,必然帶來不夠嚴謹的實驗結論。在某些情況下,如果某一種方法的前提條件并不符合,我們可以考慮換一種可以替代該方法的統計推斷方法,比較常見的有,在使用卡方檢驗前,如果發現資料中的樣本總數,不能滿足卡方檢驗的最低要求,則可以考慮換成fisher精確檢驗法重新進行分析,對應的,將會取得更為嚴謹有效的結論。
五、結束語
上述四種錯誤,統計學表達描述出現問題、使用單因素方法考慮多因素問題、盲目套用統計分析模式以及不考慮統計推斷方法使用的前提條件,造成的各類錯誤顯而易見,而在實際的醫學實驗運用統計方法的例子中,還會出現其他各類可能的錯誤。例如,對資料的設計類型沒有分辨清楚,在實驗設計初期就完全沒有考慮之后可能用到何種統計學方法,實驗設計的盲目性對后期數據的選擇產生較為明顯的影響,從而使得實驗結果出現一定程度的偏差。
總的來說,在醫學實驗中應用統計學方法出現的錯誤較為常見,而且類型繁多,本文只是總結了較為常見的幾種錯誤。由此,醫學工作者及相關實驗人員應當在日常工作當中,進一步汲取統計知識,并且一定在實驗初期確定實驗的指導思想,從而確定采取何種統計方法收集數據、分析數據、得出結論等,進而可以獲得較為理想的實驗結果。同時,還應當加強與統計方面相關人才的聯系,減少錯誤出現的可能性,這對醫學工作者進一步提高自身的科研能力和科研水平是大有裨益的。
轉載請注明來自發表學術論文網:http://www.zpfmc.com/yxlw/5758.html