单组患者生存分析(归因死亡)

全因生存分析是一种统计方法,主要用于研究从一项研究开始到感兴趣的事件(如死亡)发生的时间间隔。这种分析方法通常会考虑所有可能导致该事件的原因,因此被称为全因生存分析。

归因生存分析则是一种更细分的方法,主要关注由特定原因导致的事件发生的时间和频率。这种方法可以提供更具体的信息,例如,一个病人是由于其疾病导致死亡,还是由于其他非疾病相关的原因导致死亡。

这两种生存分析方法在医学研究中都非常重要。例如,在一个关于某种癌症的研究中,我们可能想要知道患者的整体生存期(全因生存分析),也可能对特定的死因,如由癌症直接导致的死亡(归因生存分析),更感兴趣。

考虑以下医学研究的例子:在一项研究中,研究人员关注某种癌症患者的生存时间。他们收集了患者的生存数据,包括每个患者的随访时间,以及患者是否发生了感兴趣的事件,例如死亡。通过全因生存分析,他们可以估计患者的整体生存时间和生存率。然后,他们可以使用归因生存分析,详细地查看死于癌症的患者的生存时间和生存率,以及由于其他原因导致的死亡的生存时间和生存率。

在进行全因和归因生存分析时,研究者通常需要收集大量的生存数据,包括生存时间,是否发生了感兴趣的事件,以及导致事件的具体原因等。这些数据通常会存在某些特定的模式,例如右偏分布(大多数人在短时间内发生事件,但有少数人会生存很长时间)、存在删失数据(一些参与者在研究结束前失联,导致其生存时间未知)等,这些都是生存数据的特点,需要在进行生存分析时予以考虑和处理。

例如,在全因生存分析中,由于要考虑所有可能的死因,所以往往需要更全面的数据收集和更复杂的数据处理。而在归因生存分析中,研究者需要更仔细地去查看和分析每个发生事件的具体原因,因此也需要更精细的数据处理和更高级的统计方法。

在处理生存数据时,统计软件如MSTATA可以提供大量的帮助。例如,MSTATA可以很方便地处理右偏分布的数据和删失数据,还可以自动进行生存期和生存率的估计,以及生成生存曲线等。此外,MSTATA还能够进行全因和归因生存分析,支持对多种事件结局的处理,如死于疾病(Died Of Disease, DOD)、死于其他原因(Died Of Other Causes, DOOC)、带病存活(Alive With Disease, AWD)和无病存活(Alive Without Disease, AWOD)。

利用MSTATA软件的全因和归因生存分析功能,研究者可以更有效地处理和分析生存数据,更深入地了解研究对象的生存状况,以及各种事件发生的可能性,从而为临床和公共卫生决策提供有力的依据。

以下是MSTATA在处理多事件结局时的一些主要功能:

此外,MSTATA还提供了KMunicate-Style Plot,这是一种最先进的方式来展示生存曲线和生存时间的分布。

准备数据

首先务必按照下面的格式准备数据(网站上可下载,下载后在此基础上修改):

下载csv样例数据(右为)

打开如下图:

在使用MSTATA软件进行单组生存分析(归因死亡)之前,您需要准备包含两个关键变量的数据:时间变量(time)和生存结局变量(outcome)。这两个变量的详细说明如下:

生存结局变量(outcome):表示患者在研究结束时的生存结局。在本工具中,您可以为outcome设置任意标签,但为了清晰明了,我们建议使用如下标签:死于疾病(Died Of Disease, DOD)、死于其他原因(Died Of Other Causes, DOOC)、带病存活(Alive With Disease, AWD)和无病存活(Alive Without Disease, AWOD)。在MSTATA软件中,您可以设定哪个标签代表发生事件,确保标签和实际含义相符。

时间变量(time):表示从研究开始日期到观察结束日期的时间差。研究开始日期的定义根据您的研究目的而定,例如随机对照研究通常以随机分组日期为开始,而观察性研究可以选择首次诊断日期或首次治疗日期等。关于time变量,请注意以下事项:

当outcome为 DOD 或 DOOC 时,观察结束日期为死亡的日期。

当outcome为 AWD 或 AWOD 时,观察结束日期为最后一次确认患者生存的日期(如研究结束日或随后一次随访日)。

总之,time是一个数值型变量,表示患者从研究开始到观察结束所经历的时间。例如,若time为56,outcome为DOD,则表示患者从研究开始到死于疾病共生活了56天;若time为56,outcome为AWOD,则表示患者从研究开始到最后一次随访并确认无病存活共生活了56天。time的单位可以是天、月或年,MSTATA软件可以在分析时进行转换。

在准备数据时,请确保为每个患者填写非负数的 time 和相应的outcome标签。time 和 outcome均不能为空,否则将无法进行分析。若 time 或 outcome 的数值不确定或缺失,建议不要将该患者纳入数据库。

在实际操作中,您可以根据自己的需求为outcome设置合适的标签,然后在软件里设定对应的事件含义。只要确保在MSTATA软件中正确设定标签含义即可。这将有助于用户更加灵活地应对不同的研究需求,并且更容易地理解和操作数据。

上传和导入数据

进入”导入数据”页面,点击Browse按钮上传文件,最好是.CSV文件为佳。然后务必要点击最下方的”import data” 按钮。

字段的选择和处理

数据导入之后,可以对字段做一些修改和调整:

然后在这个页面,哪怕你什么也没修改,也务必要点击”Apply Changes” 按钮,才能进入下一个页面,否则进行不下去。

选择患者

进入”选择患者” 页面,如果要选取一部分患者做亚组分析的话,在这个页面做选择和调整。

调整因子顺序

分类变量的亚组,在统计图、表中都有出现的顺序,其顺序可以人为调整:

用拖拽的方式可以调整亚组排列的顺序,排在左边的,在后续统计表中都位于上方或左方。最左边的通常会设为参照组。这里可以随时回来调整。

单组患者生存分析

下一步就是生存分析啦:

  1. 选择时间变量:在菜单中找到一个下拉菜单,标签为”请选择代表时间的变量”。在这个下拉菜单中,你需要选择代表时间的变量。对于已死亡的患者,这应该是从疾病开始到死亡的时间差。对于尚未死亡或生死未知的患者,这应该是从疾病开始到最后一次随访(即最后一次确认该患者还活着)的时间差。

  2. 设定时间单位:在菜单中找到一个单选按钮,标签为”请告诉系统您数据中的时间变量每1个单位代表的时间长度”,你可以在这里选择时间变量的单位,选项包括”天”、“周”、“月”和”年”。

  3. 输入疾病名称:在菜单中找到一个文本框,标签为”请输入感兴趣的归因死亡疾病名称”,你需要在这里输入你关注的疾病的名称。

  4. 选择结局状态:在菜单中找到一个下拉菜单,标签为”请选择代表患者最终状态的变量”。在这个下拉菜单中,你需要选择代表患者最终状态的变量。这个变量可以有四个值,分别表示死于某种疾病(DOD),死于其他原因(DOOC),带病存活(AWD),无病存活(AWOD)。

  5. 选择DOD、DOOC、AWD、AWOD代表的值:在菜单中会有四个下拉菜单,标签分别为”请下拉选择结局变量的哪个水平表示死于某疾病”,“请下拉选择结局变量的哪个水平表示死于其他原因”,“请下拉选择结局变量的哪个水平表示带病生存”,“请下拉选择结局变量的哪个水平表示无病生存”。在这些下拉菜单中,你需要选择相应的值。

  6. 选择图表的时间单位:在菜单中找到一个单选按钮,标签为”请选择后续统计图表中的时间单位,系统会自动转换”,你可以在这里选择统计图表的时间单位。

  7. 设定统计表选项和统计图选项:在菜单中,你可以设定统计表的生存率、绘制生存曲线、累积事件曲线、累积风险曲线和KMunicate曲线的选项,以及设定图像的宽度和高度。你还可以设定坐标轴的范围,输入数字即可,时间单位默认为前面菜单中选定的输出单位,如年、月、日。

  8. 输入生存率:在菜单中找到一个文本框,标签为”请输入您需要在统计表中展示的生存率,用英文半角逗号隔开。“。在这里,你可以输入你想要显示在统计表中的生存率。

  9. 设定图像选项:在菜单中,你可以选择是否绘制生存曲线、累积事件曲线、累积风险曲线,以及KMunicate曲线。你还可以设定图像的宽度和高度。

  10. 设定坐标轴范围:在菜单中,你可以设定横坐标(时间)的上限(决定曲线完整显示还是部分显示)和横坐标(时间)的每格单位刻度值。

  11. 设定其他选项:在菜单中,你可以选择是否在图像上显示95%置信区间条带,是否显示风险人数表(Risk table),以及是否显示删失(censored)数据标记。

  12. 开始分析:在菜单的最下方,你可以看到一个按钮,标签为”开始进行单组生存分析”。点击这个按钮,就可以开始进行分析了。

下载报告

点击下载word文件即可