科学家如何利用英伟达GPU集群探索银河系?

几个世纪以来,科学家们一直在通过望远镜观察绚丽的宇宙,将观察到的现象理论化,并从中得出结论。

最近,天文学家和天体物理学家开始转向GPU和AI的计算性能,试图从望远镜拍摄的图像中获得更多信息。

来自加州大学圣克鲁斯分校和普林斯顿大学的研究小组一直在挑战这一领域的极限。在加州大学圣克鲁兹分校的Brant Robertson和美国国家航空航天局·哈勃奖学金获得者Evan Schneider的带领下,该团队专注于优化NVIDIA GPU和深度学习工具的使用,以满足大规模计算的要求。

他们的目标是扩展其计算性能,进行更精确的流体动力学模拟,从而进一步了解星系的形成。

团队一开始就把工作负载从CPU转移到GPU。通过这种方式,他们可以测量三维网格细胞表面内外的物质,就好像他们可以同时解决多个魔方一样。

在CUDA平台的帮助下,研究团队可以将一系列网格转移到GPU进行必要的计算,从而获得更详细的模拟结果。

在释放了系统的大部分性能后,他们将目光投向了更强大的NVIDIA GPU集群设备,即位于美国能源部橡树岭国家实验室的泰坦超级计算机。然而,为了进行更高分辨率的模拟,他们需要更强大的代码来控制泰坦搭载的65,438+06,000多特斯拉GPU的强大性能。

施耐德是这项任务的最佳人选。她读研究生的时候是罗伯逊的学生,现在是普林斯顿大学的博士后研究员。施耐德写了一个由GPU加速的流体动力学的代码,命名为CHOLLA,即“并行架构上的计算流体力学”。

“银河风是怎么到达那里的?星系风的成因是什么?银河风是如何控制星系质量的?这些都是我们想要研究的问题,但是它们非常难以计算,”罗伯逊说。"埃文是第一个能够准确解决这个问题的人. "

使用几年前编写的CHOLLA代码,Schneider和Robertson能够在Titan上执行1亿个核心小时。这段代码的独特之处在于,它可以在GPU上执行所有操作,这使得研究团队可以在他们的实验室中对英伟达DGX和DGX-1深度学习系统进行复杂的模拟,然后将模拟结果传输到Titan进行扩展。

“你想利用GPU的浮点计算性能,你不想花时间等待信息在GPU之间来回传递,”罗伯逊说。“在GPU上花尽可能多的时间,这才是你想要实现的。”

CHOLLA可以扩展大量的GPU,使研究团队可以测试和计算5500亿个细胞,罗伯逊称之为“天体物理学中最大的流体动力学模拟之一”。

另一名学生Ryan Hausen开发了一个名为Morpheus的深度学习框架,该框架使用原始望远镜数据对星系进行分类,为更雄心勃勃的研究项目铺平了道路。有了这个框架,他们有望在DGX系统上处理数十亿个星系的大规模测量结果。

此外,另一个计划也在计划中——罗伯逊希望能够在Summit上进行计算,这是由英伟达Volta GPU提供动力的世界上最强大的超级计算机。他认为,借助Summit对GPU内存的扩展,CHOLLA可以让他们取得比使用Titan更大的研究成果。

“英伟达GPU的计算性能让我们能够进行过去不可能的数值模拟,”罗伯逊说。“接下来,我们打算用NVIDIA GPU来挑战更多的可能性。”