Huawei EPFL için HPC Sistemi Yükseltmesini Başarıyla Tamamlıyor
EPFL için yüksek performanslı bilgi işlem alanında ihtiyaçlarımızı karşılayacak yüksek kalitede bir sistem sağlamak için Transtec ve Huawei yakın iş birliği içinde çalıştı. Huawei mühendisleri tarafından sunulan mükemmel altyapı çözümleri ve Transtec’in sağladığı profesyonel planlama, kurulum ve hizmetler bizi gerçekten etkiledi.
Genel Bilgiler
Yüksek-Performanslı Bilgi İşlem (HPC), aerodinamik ve uzay teknolojileri, uzun vadeli iklim değişikliği, yüksek hassasiyetli hava durumu tahmini, okyanus akıntısı hesaplamaları, hava ve su kirliliği simülasyon analizi, sel ve deprem tahminleri, motor ve kalıp tasarımı, biyolojik hekimlik tasarımı, rüzgar tüneli testleri, petrol arama ve yeni materyal araştırması gibi çeşitli alanlarda ilerleme sağladı.
HPC günümüzde iki sebepten dolayı hızla gelişmeye ve büyük ölçüde yayılmaya devam ediyor:
Talep: İçinde bulunduğumuz veri çağında, veri büyüklüğü giderek artıyor ve insanlar daha yüksek veri analizi verimliliği elde etmeye çalışıyor. Bu durum, daha da güçlü hesaplama kapasiteleri gerektiriyor.
Teknolojik gelişmeler: Bilişim teknolojileri geçtiğimiz yıllarda hızla gelişti, artık insanlar pahalı iş gücü ve materyallere harcama yapmaktansa, HPC’nin güçlü hesaplama işlevlerini uygun maliyetlere sahip olup değerlendirmeyi tercih ediyor. Bu iki faktör birbiriyle etkileşim içinde ve böylelikle daha fazla endüstride HPC uygulamasıyla gelişmelerden faydalanabilmek adına birbirlerini destekliyorlar.
Yüksek eğitim endüstrisi bu duruma tipik bir örnek teşkil ediyor. İstatistikler, Haziran 2017’de yayınlanan, dünyanın en büyük 500 HPC kümesi arasında, yüzde 8’i aşan bir oranla, 41 tanesinin üniversite kuruluşlarında bulunduğunu gösteriyor. Peki, yüksek eğitim endüstrisi neden HPC’den faydalanıyor? Üniversiteler, fizik, kimya ve biyoloji gibi ilgili bölümlerde HPC kullanıyor. Bu durum, HPC’nin yüksek eğitim endüstrisinde hızla gelişmesinin sebebini ortaya koyuyor.
Zorluklar
École Polytechnique Fédérale de Lausanne (EPFL), QS Dünya Üniversite Sıralaması’nda 12.sırada bulunan ve dünyadaki en iyi üniversiteler arasında gösterilen bir eğitim kurumudur. EPFL, öğrencileri, profesörleri ve 120 ülkeden kadrosu ile mühendislik teknolojileri ve doğa bilimleri alanında herkes tarafından bilinen bir üne sahiptir. Endüstri lideri bilimsel araştırma düzeyini devam ettirmek adına, EPFL ilk HPC sistemini 2008 yılında tüm öğrenci ve akademik kadronun kullanımına sundu ve o zamandan itibaren HPC sistemini sürekli olarak geliştiriyor.
EPFL kaynakların artık yetersiz kalıyor oluşundan dolayı, gelecekte rekabet edebilirliği arttırmak amacıyla 2016 yılından itibaren HPC sistemlerini yükseltme ve büyütme planlaması yapıyor. EPFL, HPC değerlendirme, HPCG testi ve bilim, mühendislik, biyoloji ve sağlık alanında çeşitli uygulamalarla karşılanması gereken tüm gereklilikleri listeledi. Tüm bu uygulamaların düzgün bir şekilde çalışmaya devam etmesi gerekiyor.
Bunlara ek olarak, teorik hesaplama kapasitesi ≥ 475 TFLOPS, paylaşımlı depolama ≥340 TB, okuma/yazma bantgenişliği 40 Gbit/sn’ye kadar, kabinler ≤ 8 ve kabin başına güç tüketimi≤ 25 kW gibi pek çok zorunlu sistem gereksinimi bulunuyor. Sistemin açık, kolay yönetilebilir ve ölçeklenebilir olması da gerekiyor. İş ortaklarının teknoloji alanında ileri görüşlü olması ve EPFL’ye önümüzdeki beş yıl içinde 5 PFLOPS HPC kümesi kurulumu için yeterli desteği sağlayabilmesi gerekiyor.
Çözüm
Huawei, Transtec ile birlikte aralıksız detaylı analizler gerçekleştirerek bir çözüm tasarlıyor. Topoloji şeması aşağıdaki şekildedir:
Bu çözüm, işlem düğümleri olarak dağıtılan 408 FusionServer XH620 sunucusuna ve her bir düğümde teorik hesaplama üst değeri 475,2 TFLOPS olan iki Intel Xeon E5-2690 v4 CPU’ya sahiptir. Layer-2 Fat-Tree ağ yapılandırma teknolojisini benimseyen InfiniBand ağı kullanılır. Depolama sistemi, altı OceanStor 5800 sistemi ve 350 TB kapasiteli Genel ParalelDosya Sisteminden (GPFS) oluşur.
Avantajlar
Huawei, EPFL çözümü için olağanüstü sonuçlar elde eden birtakım ileri düzey ürün ve teknolojilerini seçti. Örneğin, kullanılan FusionServer X6800 yüksek yoğunluklu sunucular, tek kabin hesaplama kapasitesini yüzde 70 oranında artırırken, gereken kabin sayısını yüz 40 oranında azalttı. Çözümde FusionServer X6800 kullanılmış olsaydı, 8 işlem düğümünün yerleştirileceği 4U şasi ve aynı zamanda 16 CPU gerekli olacaktı. Standart 1U iki soketli sunucular kullanılmış olsaydı, 8U şasi gerekli olacaktı. Sonuç olarak, toplam 48 işlem düğümünü yerleştirmek için 10 kabin yerine yalnızca 6 kabin gerekti. FusionServer X6800, ısı dağıtımı tasarımını ve Dinamik Enerji Yönetimi Teknolojisi ‘ni (DEMT) benimser, bu nedenle güç tüketimi geleneksel raf sunucusundan yüzde 10 ila 20 daha düşüktür. Diğer özellikleri burada detaylı olarak belirtilmemiştir.
Yüksek verimlilik, performans, ölçeklenebilirlik ve kolay yönetimi temel alan bu çözüm yaygın bir şekilde onaylanarak etkin bir şekilde kullanılmıştır. Çözüm gerçek uygulamalarda, kullanıcıların gereksinimlerini eksiksiz bir şekilde karşılar ve ölçülen hesaplama gücü yüzde 84,4’e kadar çıkan verimlilikle 401 TFLOPS’dir.
EPFL ve Huawei, EPFL SCITAS tarafından geliştirilen Fidis HPC kümesinin Haziran 2017’de başarıyla piyasaya sürüldüğünü duyurdu.
EPFL SCITAS Yöneticisi Vittoria Rezzonico kendisiyle yapılan bir röportajda Huawei’den övgüyle bahsetti: “EPFL için yüksek performanslı bilgi işlem alanında ihtiyaçlarımızı karşılayacak yüksek kalitede bir sistem sağlamak için Transtec ve Huawei yakın iş birliği içinde çalıştı. Huawei mühendisleri tarafından sunulan mükemmel altyapı çözümleri ve Transtec’in sağladığı profesyonel planlama, kurulum ve hizmetler bizi gerçekten etkiledi.”