什么是高性能计算?高性能计算是计算机科学的一个分支,主要指从体系结构、并行算法、软件开发等方面研究和开发高性能计算机的技术。随着计算机技术的快速发展,高性能计算机的计算速度在不断提高,其标准也在不断变化。高性能计算仅仅意味着在16台或更多服务器上完成某些类型的技术工作负载。这个数字是否需要8、12或16台服务器并不重要。根据我们的定义,我们假设每台服务器都运行着自己独立的操作系统,并且其相关的输入/输出基础设施都建立在COTS系统上。简而言之,我们说的是Linux高性能计算集群。一个拥有2万台服务器的信息中心进行分子动力学模拟是没有问题的,就像一个小型工程公司在自己的机房运行计算流体力学(CFD)模拟一样。解决工作量的唯一限制来自技术层面。接下来我们要讨论的问题是什么可以直接应用。指标到目前为止,很少有人讨论Linux高性能计算集群的纯性能。目前我们遇到比较多的词汇像性能、性能功耗比(Performance/Watt)、性能/平方英尺(performance/dollar)、性价比(Performance/dollar)等等。对于上面提到的两万台服务器,原因显而易见。运行这样的系统通常会受到服务器的能耗(瓦特)和体积(平方英尺)的限制。这两个要素都包含在总拥有成本(TCO)中。在总拥有成本(TCO)方面实现更大的经济效益是每个人都非常关心的问题。在以下讨论中,本主题的范围仅限于性能,以帮助您理解性能能耗、性能密度和TCO在实践中的重要性。绩效的定义在这里,我们将绩效定义为一个计算率。比如每天完成的工作量,每秒浮点运算(FLOPs)的速度等等。在下面的讨论中,我们应该考虑给定工作量的完成时间。两者直接相关,速度=1/(时间/工作量)。所以性能是根据运行的工作量来衡量的,通过计算它的完成时间来换算成需要的速度。定量和定性方法如何优化HPC的性能?在定性的层面上,这个问题很容易回答。答案是更快的处理器、更多的内存、更好的性能网络和磁盘输入/输出子系统。但是当你决定是否购买Linu cluster时,这个答案就不够准确了。如何定量分析Linux高性能计算集群的性能?为此我们会介绍一些量化的模型和方法技巧,可以非常准确的指导你的商业决策,同时也非常简单实用。例如,这些业务决策涉及以下几个方面:采购——选择系统组件以获得最佳性能或最经济的性能配置的指南——识别系统和应用软件中的瓶颈计划——突出性能的相关性和局限性以制定中期业务计划。本文中的Linux高性能计算集群模型包括四种主要的硬件组件。(1)执行技术工作负载的计算节点或服务器;(2)用于集群管理、工作控制等的主节点;(3)相互连接的电缆和现在高度流行的千兆以太网(GbE);(4)有些全局存储系统就像主节点输出的NFS文件一样简单易用。目前,计算速度(尤其是浮点运算速度)是衡量高性能计算机的主要标准。高性能计算机是信息领域的前沿高科技,对维护国家安全、推动国防科技进步、促进尖端武器发展具有直接作用。它是衡量一个国家综合实力的重要标志之一。
随着信息社会的快速发展,人类对信息处理能力的要求越来越高。不仅是石油勘探,天气预报,航天国防,科学研究等。需要高性能计算机,同时也是金融、政府信息、教育、企业、网络游戏等更广泛领域对高性能计算的需求。增长迅速。
标签:性能高性能服务器