- SAS統(tǒng)計分析教程
- 胡良平編著
- 1939字
- 2019-03-01 11:35:07
3.2 生存資料統(tǒng)計描述
3.2.1 問題與數據
【例3-1】某醫(yī)師收集11例腦瘤患者甲療法治療的生存時間(周),試估計治療后不同時間的生存率、生存曲線及中位生存期。
甲療法組:5 7+13 13 23 30 30+38 42 42 45+
【例3-2】收集374名某惡性腫瘤病人隨訪資料,取時間區(qū)間均為1年,整理結果如表3-1所示,試估計確診后不同年數的生存率、生存曲線、中位生存期等。
表3-1 某惡性腫瘤病人隨訪資料與生存率計算過程

注:生存時間長于10年者有47例。
3.2.2 對數據結構的分析
對于例3-1資料,研究者選取11名同質的腦瘤患者,觀察他們采用甲療法治療后的生存時間。從設計類型來說,本例應為單組設計。因生存時間是定量的觀測指標,故資料類型為單組設計一元定量資料。當然,由于部分受試對象的觀測數據是不準確的,常稱為截尾數據或刪失數據,此資料是單組設計一元生存資料。
例3-2資料與例3-1相似,設計類型為單組設計,資料本質為單組設計一元生存資料。
3.2.3 分析目的與統(tǒng)計分析方法的選擇
非參數法估計生存率有乘積極限法(Product-Limit Method,PL)和壽命表法(Life Table Method),其中乘積極限法又稱為Kaplan-Meier法(簡稱KM法)。前者適用于小樣本或大樣本未分組資料,后者適用于觀察例數較多的分組資料。
對例3-1資料,甲療法組的生存數據為含有截尾數據的小樣本未分組資料,宜采用Kaplan-Meier法估計生存率和生存曲線。
對例3-2資料,該惡性腫瘤隨訪資料觀察例數較多,并且根據隨訪時間和隨訪結果編制成頻數分布表的形式,處理此類資料宜采用壽命表法估計生存率。
3.2.4 SAS程序
分析例3-1資料,采用Kaplan-Meier法,程序名為SASTJFX3_1.SAS。

數據步中,變量t、status分別表示生存時間和生存結局,其中status=1表示某終點事件發(fā)生,如死亡;status=0表示截尾。
LIFETEST過程可對生存資料進行KM法或壽命表法估計,并對兩組或多組生存率做組間比較,包括Log-Rank檢驗、Wilcoxon檢驗和似然比檢驗,其中似然比檢驗基于指數分布。
PROC LIFETEST語句中的選項如下。
(1)METHOD=PL|KM|LT|LIFE|ACT,指定生存率估計方法。PL和KM表示乘積極限法或KM法(默認值);LT、LIFE和ACT表示壽命表法。當使用壽命表法時,SAS可自動生成生存時間的分組區(qū)間,也可用“WIDTH=”人為指定區(qū)間寬度,或用“INTERVALS=(a to b by c)”,a、b、c分別表示區(qū)間的初值、終值和組區(qū)間的寬度。(2)PLOTS=( ),要求繪圖。括號內可填寫的內容有S、LS、LLS、H。若同時填多項,各項之間用逗號隔開,H選項僅在使用壽命表法時有效。各選項的具體含義如下:SURVIVAL(或S)表示生存率S )?(t對生存時間t的圖形,即生存曲線;LOGSURV(或LS)表示?logS(t)? 對t的圖形,用于判斷生存時間是否服從指數分布。若呈指數分布,則圖形應呈過原點的直線;LOGLOGS(或LLS)表示log[?logS(t)]? 對logt的圖形,用于判斷生存時間是否服從Weibull分布。若呈Weibull分布,則圖形應呈直線;HAZARD(或H)表示累積風險Ht)?(對t的圖形。只有當使用壽命表法時,才出現HAZARD圖形。
TIME語句為LIFETEST過程的必須語句,設置生存時間變量和生存結局變量,括號內為截尾變量的標示值。
分析例3-2資料,采用壽命表法,程序名為SASTJFX3_2.SAS。

數據步中變量t、status和number分別表示每個時間區(qū)間的中點、生存結局(死亡=1,截尾=0)及其頻數。過程步中指定生存率的估計方法為壽命表法,時間區(qū)間寬度為1。同時,用FREQ語句指定頻數變量。
3.2.5 主要分析結果及解釋
以下是SAS軟件輸出的關于例3-1的分析結果。

Summary Statistics for Time Variable t


輸出的第一部分是甲療法組生存率的KM法估計結果。統(tǒng)計量包括各生存時間點對應的生存率(Survival)、死亡率(Failure)、生存率標準誤差(Survival Standard Error)、累積死亡數(Number Failed)和期末例數(Number Left)。
結果表明,采用甲療法治療,5周生存率為90.91%,13周生存率為70.71%,其他依次類推。注意:
(1)生存時間一欄標有“*”者為截尾生存時間,其生存率和生存率標準誤差用“.”表示,實際上該截尾生存時間的生存率和生存率標準誤差與前一個完全生存時間對應數值相同。如7周生存率為90.91%。
(2)兩個完全生存時間之間任意時間的生存率均等于前一個完全生存時間的生存率,如6個月(即24周)生存率為60.61%。
第二部分輸出生存時間的分位數,包括75%、50%和25%分位數的點估計及95%置信區(qū)間。50%分位數即中位生存期,為38周,95%置信區(qū)間為13~42(周)。
最后一部分概括截尾和非截尾例數。本資料總例數為11,其中死亡為8例,截尾為3例,截尾百分比為27%。
Kaplan-Meier生存曲線為階梯形曲線,如圖3-1所示。

圖3-1 甲療法治療腦瘤患者Kaplan-Meier生存曲線
以下是SAS軟件輸出的關于例3-2的分析結果。

SAS輸出統(tǒng)計量包括各生存時間區(qū)間內(Interval)的死亡數(Number Failed)、截尾數(Number Censored)、期初有效例數(Effective Sample Size)、條件死亡概率(Conditional Probability of Failure)、條件死亡概率標準誤差(Conditional Probability Standard Error)、區(qū)間左端點處生存率(Survival)、死亡率(Failure)、生存率標準誤差(Survival Standard Error)、中位剩余壽命(Median Residual Lifetime)、中位剩余壽命標準誤差(Median Standard Error)及各時間區(qū)間中點處的概率密度函數(PDF)、概率密度函數標準誤差(PDF Standard Error)、風險函數(Hazard)和風險函數標準誤差(Hazard Standard Error)。
結果表明,該類惡性腫瘤患者1年生存率為75.94%,2年生存率為55.61%,其他依次類推。
- 砂性土宏細觀特征數值分析研究
- 電子商務數據分析:大數據營銷 數據化運營 流量轉化(微課版·第3版)
- 我與國防一起成長:大學生國防教育與軍訓教材(第三版)
- 汽車維修基礎
- 2020年甘肅省軍轉干部安置考試《申論》考點精講及典型題(含歷年真題)詳解
- 童明《美國文學史》配套題庫【課后習題+章節(jié)題庫(含名校考研真題)+模擬試題】
- 數據科學技術與應用
- 范里安《微觀經濟學:現代觀點》(第9版)筆記和課后習題詳解
- 移動音頻編碼丟幀隱藏技術與應用
- 中國地質大學(武漢)外國語學院242俄語(二外)歷年考研真題及詳解
- 紡織材料學(第4版)
- 注冊土木工程師(巖土)《專業(yè)知識考試》歷年真題與模擬試題詳解
- 基礎會計教程
- 青春與安全同行:大學生安全教育
- 北京交通大學語言與傳播學院211翻譯碩士英語[專業(yè)碩士]歷年考研真題及詳解