论文中统计报告的注意事项多因素模型和诊断

北京中科白癜风医院公益中国 http://disease.39.net/bjzkbdfyy/180102/5972953.html

作者:杨超鲁艺斐李延龙张耀文

年3月,EuropeanUrology杂志(IF17.)发表了泌尿外科临床研究领域的统计报告指南《GuidelinesforReportingofStatisticsforClinicalResearchinUrology》,目的在于提升人们的统计学知识,改善论文质量。

在之前的文章“医学论文中统计报告要注意的诸多细节:p值、置信区间...”中,我们介绍了p值、置信区间、研究估计值等报告时要注意的问题,今天这篇文章我们再来看一看多因素模型和诊断试验中统计报告的注意事项,以及结论和解释部分要注意的问题。

1.多因素模型和诊断试验

1.1多变量回归、倾向性评分和工具变量并不是一根魔棒

有研究者认为多变量调整可以“消除混杂”、“使两组相似”或“模拟随机试验”。但这个说法有两个问题:首先,记录在数据集中的变量值通常是近似值,因此可能会掩盖组间差异。

例如,当使用临床分期作为协变量,比较不同治疗方案对局限性前列腺癌的预后时,如果一组临床分期为T2c期患者多于另一组,那么该组的预后可能会更差。但是T2c期也具有不同表型。多变量调整T2c时,并不能保证T2c的不同表型也完全相同。

其次,模型只针对少数测量的协变量进行调整,并不能排除未测量(甚至不可测量)的协变量存在重要作用的可能性。通常情况下,倾向性评分匹配比传统的多变量回归能更好地调整混杂因素。工具变量法的效果则主要取决于工具变量的质量。在许多情况下,工具变量与干预没有很强的关联,这导致了95%CI的大幅增加;而在某些情况下,则会低估治疗效果。

1.2避免完全依赖“逐步选择”

研究者通常根据单因素分析的结果来选择多因素模型中要纳入哪些变量;或者,先将所有变量都纳入到一个模型中,然后删除那些统计学意义不显著的变量。然而,这种完全依赖现有数据的变量选择方法在回归模型的建立过程中并不可取,可能会增加过度拟合的风险,并使许多统计量(如95%CI)受到高度质疑。逐步选择法应该限定于特定情况,比如在模型建立的初期,对哪些变量可能是预测变量知之甚少的时候。

1.3在检验干预措施的效果时,避免报告协变量的OR值或HR值

一个研究应该只回答一个科学问题。比如,研究者在探讨两种不同根治性前列腺切除术对疾病复发的影响,应当着重报告两种术式的OR值或HR值。尽管模型可能会调整诸如临床分期、分级以及前列腺特异抗原(PSA)等因素(协变量),但报告这些因素(协变量)的OR值或HR值对主要研究问题反而没有帮助,反倒会干扰读者对研究主要结果的


转载请注明:http://www.beicanshijie.com/sxjq/13922.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了