分组(Cohorts)
为每个数据实例计算风险评分,并将其分为高风险和低风险人群。
输入
- 数据:参考生存数据集
输出
- 数据:在参考数据集中新增两个变量:一个存储计算后的风险评分(连续变量),另一个为二元变量,用于将实例分为低风险和高风险人群。
分组组件接收生存数据集,并为每个数据实例分配风险评分。该风险评分基于拟合的Cox回归模型计算得出。组件会在输出数据集中新增一个连续变量(存储计算后的风险评分)和一个二元变量(将数据实例分为高风险和低风险人群)。分层方式支持三种阈值定义方法:中位数、均值或时序检验(Log-rank test)。
示例
以下示例中,我们使用数据集组件加载内置的德国乳腺癌研究组2(German BC2)数据集。将生存数据输入分组组件后&#