广义相加模型(Generalized Additive Models, GAM)
广义相加模型(Generalized Additive Models, GAM) 是一种灵活的统计建模方法,可以处理自变量和因变量之间的非线性关系。GAM 将回归问题扩展到更广泛的模型形式,不仅支持传统的线性回归,还能够使用平滑函数描述自变量与因变量之间的非线性关系。因此又被称为万能回归模型。
Piecewise 线性回归 | Piecewise Cox 回归 | Piecewise Poisson 回归 |
---|---|---|
1. GAM 的基本原理
平滑函数
GAM 的核心思想是利用平滑函数(如样条函数)来拟合自变量与因变量之间的关系。与传统回归模型不同,GAM 可以灵活地捕捉自变量和因变量之间复杂的非线性关系。回归与平滑的结合
在 GAM 中,自变量与因变量的关系被分为线性部分和非线性部分。线性部分通常是固定效应,而非线性部分则通过平滑函数来建模。灵活性和可解释性
GAM 具有较高的灵活性,可以适应数据的非线性模式,同时保持模型的可解释性。通过选择合适的平滑函数和回归模型,GAM 适用于多种类型的数据分析任务。选择合适的平滑函数
在 GAM 中,可以选择不同的平滑函数。平滑函数的选择依赖于自变量的分布和数据的特性。
2. 在医学科研中的应用及优势
处理非线性关系
许多医学研究中的数据呈现出非线性关系,例如血糖水平与疾病风险之间的关系。在这种情况下,GAM 能够通过平滑函数有效地捕捉这些非线性趋势。多因素回归中的非线性建模
在多因素回归中,GAM 可以对自变量与因变量的关系进行灵活建模,特别是在存在多个因素时,能够更好地识别潜在的非线性关系。个体化医疗分析
GAM 可以帮助临床研究人员在个体层面上识别关键的健康指标,从而为个体化医疗方案提供支持。灵活的模型设定
GAM 允许用户根据数据的特性灵活选择平滑函数,避免了强假设的局限性。
3. 举例说明
例 1:BMI 与心血管疾病风险
研究背景:在大量的队列研究中,体重指数(BMI)与心血管事件风险并非简单的线性正相关。有些人观察到当 BMI 过低时,风险同样升高,出现 U 型关系。
方法:采用 GAM 在 Cox 回归模型中,将 BMI 作为连续变量引入,并设置合适的平滑函数进行分析。
结果:发现,BMI ≈ 22 kg/m² 时心血管风险最低,过高或过低都增加事件发生率。
意义:帮助临床人员确定 BMI 更精确的风险趋势范围。
例 2:血压与心脏疾病的关系
研究背景:血压水平与心脏疾病的关系被认为是非线性的,特别是高血压对心脏事件的风险影响较大。
方法:采用 GAM 模型,在 Cox 回归分析中引入血压作为平滑自变量,并控制其他协变量。
结果:结果表明,当血压升高至某个阈值时,风险显著增加,展示了血压与心脏疾病的非线性关系。
总结:GAM 对于有理由怀疑“自变量-结局”存在非线性关系的医学研究而言,是一项灵活且实用的方法。它能够帮助研究人员揭示和解释真实世界中复杂的非线性关系,并且在临床和流行病学的高分论文中得到了广泛应用。
4. 软件操作说明书
生成 GAM 曲线
点击上方第二个 Tab “生成广义相加模型曲线” 进入主功能界面。此界面分为 左右两大区域:
左侧侧边栏(Sidebar):主要用于设置模型参数(如结局变量、协变量、结局类型等),以及图形的基本外观设置。
右侧主区域(Main Panel):展示 GAM 模型输出,并展示三种风格的 GAM 图像。
设置模型
- 回归类型选择:选择回归类型如 Logistic 回归、Cox 回归等。
- 结局变量选择:根据研究目标选择适合的结局变量。
- 自变量与协变量选择:选择需要进行平滑处理的自变量及可能影响结果的协变量。
设置图像外观
- 选择图像样式(基础版、华丽版等)。
- 自定义颜色、坐标轴标题、字体大小等。
生成模型并查看图像
点击“生成/更新广义相加模型曲线”按钮,即可得到拟合的 GAM 曲线,并显示在右侧区域,支持多种格式的下载。
阈值效应和 piecewise 回归(第 4 个 Tab)
如果确有非线性,且对折点附近的转折效应感兴趣,我们通常会做 分段回归(Piecewise regression),以量化在不同区间的回归系数(OR/HR/RR/beta)。
点击进入“阈值效应和 piecewise 回归”:侧边栏将出现以下几个关键选项:
方法选择:
segmented
包自动寻找折点- 设置一个或多个折点数量(npsi),系统会在给定数量下用迭代算法自动找最优位置;或者指定一个“起始值 psi”,让软件从该位置附近开始自动迭代定位折点。
人为指定折点
- 直接输入要分段的所有折点值,软件就会对每个区间做线性回归。
选择协变量:可与 GAM 分析时相同,也可自行更改。
生成 Piecewise 回归结果:点击“生成/更新 piecewise 回归分析结果”后,右侧会显示分段后的各区间斜率及其 95% CI、P 值等。
结果解读:
系统输出一份表格:展示每个分段区间内,该连续自变量对结局的回归系数(或 OR、HR、RR)及统计显著性。
还会给出一幅分段回归的可视化图:如果采用
segmented
包自动寻点,曲线上会以折线或分段斜率的方式显示;若是“手动指定折点”,则会显示分段后的拟合线。
提示:Piecewise 回归并不是简单地把数据按某个阈值拆分成两组后各自做单独回归,而是直接在同一个模型中通过截断函数(Truncated function)实现分段的线性拼接,因此在区间交界处保持连续,并能很好体现一条连续变量可能在不同区间中存在不同的风险趋势。
下载 word 报告(第 5 个 Tab)
在这里可一键导出 Word 文档,以便写论文或留档。下载之前需先完成前面 GAM 或 piecewise 回归的分析。文档包含以下内容:
Objective & Methods:关于本次 GAM 或 piecewise 分析的文字描述
Results:自动带入 GAM 模型结果、P 值、节点位置等
图像:自动插入一张 GAM 曲线或分段回归示意图
请注意:
下载后若用微软 Office 打开,排版能更好地保留;WPS 有时会有兼容问题。
如果希望对报告中的文字进行修改或补充,可直接在 Word 中手动编辑。
查看 R 源代码和原始输出(第 6 个 Tab)
下载 dt.RData:先点击“下载源代码配套的数据集 dt”,之后在 RStudio 等环境中执行
load("dt.RData")
即可加载同样的数据集。查看或下载 R 源代码:下方会显示两块黑底区域:
GAM 建模代码及输出:可复制到本地 R 运行。
Piecewise/segmented 代码及输出:同理。
二次验证:审稿人或课题组内成员如想复现结果,可直接在本地运行下载的 R 代码和数据。
下载报告与源代码
生成模型结果后,可以下载包含 GAM 分析、模型拟合表格、图像的 Word 报告,并获取 R 源代码以便复现分析结果。
通过以上步骤,您可以轻松生成符合 SCI 期刊要求的 GAM 图像及分析报告,帮助您在临床研究和流行病学研究中进行更精确的分析。