A. Smoothed particle hydrodynamics
SPH는 모든 입자가 인접 입자와의 상호작용을 통해 물리 량을 계산하기 때문에, 순차적인 코드 대비 병렬 코드의 속도가 월등합니다. 아래 그래프는 이러한 점을 극명하게 보여줍니다. 아래 그래프는 CPU 코어 1개 또는 8개를 사용했을 때에 비해 GPU에서 속도가 몇 배 빨라졌는지 나타내는데, CPU보다 더 많은 코어를 가지고 있는 GPU를 사용했을 때 더 성능이 좋아진 것을 확인할 수 있습니다.

B. Lattice Boltzmann Methods
LBM은 각 노드에서 속도의 확률 분포를 연결된 노드 사이에서만 계산하기 때문에 지역적 연산이 주를 이루어 병렬화에 용이하다고 할 수 있습니다. 아래 그래프는 순차적으로 CPU에서 LBM을 실행을 때와 병렬적으로 GPU에서 실행했을 경우, 단위 시간동안 계산된 격자와 스텝 수를 통하여 성능을 측정하였습니다. 아래의 그래프와 같이 GPU 병렬 컴퓨팅을 적용한 후에 성능이 향상된 것을 알 수 있습니다.

NFLOW는 직렬 처리를 위해 적은 코어를 사용하는 CPU가 아닌 병렬 처리에 적합하게 많은 코어를 사용하는 GPU 기반 병렬 컴퓨팅을 통해 연산 속도의 혁신을 달성하였습니다. 그러나 GPU 병렬 컴퓨팅을 적용하였다고 하더라도 사용되는 자료구조와 알고리즘에 따라서 성능의 최적화가 필요합니다. 따라서 E8IGHT는 이에 멈추지 않고 연산 효율성을 높이기 위해 Multi-GPU 기술을 개발하여 NFLOW에 적용하였습니다.