扳手纸
亚历山大
在流行病学或医学论文中,对研究对象基本情况的描述通常是以表格的形式进行的,放在结果部分的开头,即表1。主要内容是研究对象的概况和研究变量或协变量的分组显示。
前几天花了两天时间分析数据,修改文章,包括近1天的手工数据录入(从R studio把分析结果整理成Excel或者word),不仅耗时,还非常容易出错。我一直在努力找时间通过R markdown编程制作表格的过程,但是效果并不理想。
这次痛定思痛,从表1开始,找到了几个好方法。其中有一个可读性和可编辑性更强,所以我学了一下,作为一个非常实用的工具分享给大家。
这里主要参考一个使用knitter:table mania的博客快速发布,并对细节进行处理和注释。
1数据的准备
数据主要来源于开机包的黑色素瘤。加载后,看看数据的基本结构。
接下来简单整理数据,为后续分析做准备;
将分类变量定义为因子类型,并设置标签(建议在此处设置一个新变量,仅用于制作表1,不影响后续分析);
2安装和加载r包Gmisc
加载“Gmisc”时需要加载后两个包。
3.自定义函数,制作表格。
根据已有功能自定义功能,并制作表格。定义一个函数,输入数据集的变量,得到变量的统计结果:
函数定义完成后,建立一个空列表来存储每个变量的分析结果,分析结果存储在列表中:
将所有结果合并成一个矩阵,建立r组(表1第一列的变量名)和n.r组(表1第一列的每个变量的行):
结果如下:
当然,在某些情况下,添加额外的列标题是必要的。怎么加?
如下所示:
结果如下:
4导出结果
点击R studio viewer窗口中的白色按钮,在浏览器中打开,然后复制粘贴到word中进行进一步的处理和修饰。
刺激吗?
应该还有其他导出方式,但是这个很方便。
扩展功能选择
1.第二类中只显示一个变量(如男性和女性)。只要getDescriptionStatsBy的“show_all_values”参数设置为FALSE
2.显示缺少的值。getDescriptionStatsBy的“useNA”参数设置为“ifany”,表示如果有缺失值,将显示缺失值;如果设置为“否”,则表示缺失值从不显示;“始终”表示无论是否有缺失值,都会显示缺失值;
13.Total列可以删除,getDescriptionStatsBy的“add_total_col”参数可以设置为FALSE。
缺点
1.差异检验是一种非参数方法。虽然没有错,但是一般符合参数检验条件的数据还是需要使用参数检验方法。在这里,您可以在自测后修改P值。
均值(SD)的显示形式中有一个括号,感觉有点别扭。我还是不知道怎么去除。欢迎有方法的朋友分享交流。
除此之外,还有一些其他的制作表格1的R包,比如table 1(R包的名字),tableone包,其他的生成表格的R包(plyr等。).个人感觉这是最容易理解和掌握的,有兴趣可以去挖掘和对比其他包的功能。
原文链接:lgtxxjamtfgxb 8 ka 8 vinksxdo 6 a 1 qxny-4k 8 aye 9 wumyksarbldywo-vazmcnpjia 5 agfabifighao &;新=1