Menu

统计学上的“多变量”一词: 该使用multivariate还是multivariable?

2017 / 10 / 2

431

0

根据《韦氏大字典》的解释,multivariate和multivariable属同义词,两者皆表示:
包含多个变量。唯一的差异在于multivariable属一般词汇,而multivariate则具有统计意义。
遵循这个解釋,华乐丝在校阅编辑学术论文时,常将这两个词交互使用。

但有一位委托我们编辑论文的学者,并不认同此做法,且写信告诉我们multivariate这一字之
所以具有强烈的统计意涵是因为它代表多个因变量y的存在,即一项包含多个y的分析。然而,
该学者的论文仅提到多个主变量x(多个干扰 变量),并没有针对y的分析,也即没有用到
multivariate分析方式。因此该学者认为multivariate这一字并不适用于他的论文。

为此,我们的团队召开了一连串的研究与讨论,针对: 多变项回归分析应该是
Multivariate Regression 还是 Multivariable Regression?

 

在讨论过程中,我们发现在Hidalgo和Goodman的研究中提到:

大多数 回归模型的描述是根据结果 变量(outcome variable)的模型而定: 线性回归
(linear regression)是连续性的结果变量、罗吉斯回归(logistic regression)具有二分式
结果(dichotomous outcome),而存活分析(survival analysis)包含时间结果预测
(time to event outcome)。就统计学观点而言,multivariate analysis指的是具有两个或
两个以上的因变量或结果变量的统计模型,而multivariable analysis指的是具有多个自变量
或反应变量(response variable)的统计模型。

一个multivariable model可以视为多变量出现在方程式右边的模型。这类的统计模型可以用    

来评估数个变量间的关系。一边评估它们的独立关系时,也可以调整潜在性的混杂因素    

(confounder)。    

    

一个简单的线性回归模型包含一个连续结果和一个预测因子;而一个多元回归
(multiple regression)或多变项线性回归(multivariable linear regression)模型则包含
一个连续结果和多个预测因子。

线性回归的情况也相同。罗吉斯 回归和比例风险回归模型(proportional hazards regression
model)可属简单或多变量的模型,且这些模型结构都具有一个结果变量和一个或以上的自变
量或预测变量。

相较之下,multivariate指的多变量通常源自于纵贯性研究 longitudinal study);其中,同
一个个体的测量 (重复测量)于多个时间点上进行。或者,multivariate指的是套迭/镶嵌
(clustered/nested)资料,其每一个集群包含着多个研究个体。

Hidalgo和Goodman的研究统计了单词multivariate的使用广泛性。这两位学者使用PubMed
图书库及关键词multivariate检阅了2010年12月至2011年11月期间刊登在
《American Journal of Public Health》的期刊论文。这两位学者发现其中有30篇论文中出现
了multivariate一词。

通过对这些论文进行逐篇检阅,发现其中有5篇使用了multivariate model;且这5篇中,又有
4篇的分析模型源自于纵向资料,而1篇的分析模型来自镶嵌数据。至于剩下的25篇论文,皆
使用multivariable analyses;其中,罗吉斯回归(30篇中的21 篇,相当于70%)是最常被使
用的模型,次之为线性回归模型(30篇中的3篇,相当于10%)。有趣的是,30篇论文中有2
篇出现了multivariate和multivariable此二字交互使用的情况。此现象说明了这两个统计用词
需具一致性。

虽然有些人会认为multivariate和multivariable的替换互用性仅仅牵涉语意上含意,但我们编
修团队认为区分二者的差异是相当重要的。一般而言,研究中所使用的模型应该属simple或
multivariable模型,以表示预测因子的数量和结果种类(如:连续、二分式、重复测量和时
间结果预测),以及表示线性、罗吉斯、多变量或比例风险模型。

此研究指出了多变量需要更精确的应用和阐述。许多作者仍然持续使用multivariate来描述统
计,不论multivariate是否关乎结果或解释变量。我们的责任不只是避免读者混淆,也要让所
有研究人员了解正确的使用方式。

我们团队相当感谢这位学者的来信,提醒我们未曾留意的multivariate和multivariable的使用
差异。未来,我们将对于该两词的使用更加谨慎。

 

Reference:

1. Hidalgo B, Goodman M. Multivariate or multivariable regression?
Am J Public Health. 2013;103(1):39–40 [ PMC free article] [ PubMed]

 

希望以上解答对您有所帮助。如果您想了解学术论文编辑的服务
请寄email给我们(电子邮件信箱: editing@wallaceediting.cn
浏览我们的网站 www.wallaceediting.cn
或致电(021)51720415
所有的费用我们都可以为您开立公司发票。

Critique、Evaluate、Criticize、Justify、Elaborate 及相关单字的差异性为何?
如何使用修饰语,让语意表达更完善?