如何快速画出论文的表格1(基本特征三线表)?你值得拥有tableone套餐。
我们来看看没有任何数据处理的表1。
从表中可以看出,数值变量用均值标准差的形式描述,有些分类变量用频数百分比的形式描述,但有些分类变量如stage是用数值变量描述的,所以我们还是要稍微处理一下,让R知道哪些是数值变量,哪些是分类变量。
查看pbc数据集包含哪些变量。
选择要显示的变量。
这时候我们就可以看到分类后的变量可以正常显示了。
另一个可能被忽略的问题是,有些变量虽然是数值型变量,但却是非正态的,此时无法用均值和标准差的形式来描述。
你可以看到毕丽和CHOL变量已经显示在中位数和四分位数。
在给定的p值中,分类变量默认使用卡方检验;对于连续变量,默认情况下使用单向方差分析,当使用两组时,方差分析用于t检验。
但是,就像我刚才说的,有些数值变量不是正态分布的,所以不能用方差分析或者t检验进行组间比较。这时候就需要进行非参数检验,对于不满足卡方检验条件的就需要进行fisher精确检验。例如:
将结果输出到excel并放在磁盘F上:
你可以根据杂志的要求自己整理。
附:
数值变量包括:缺失值数量、比例、平均标准差、四分位间距和偏度峰值。
因子变量包括:缺失值个数、比例、水平数、频率和累计频率。