2 ExaFLOPS, On Binlerce CPU ve GPU

featured

Argonne Ulusal Laboratuvarı ve Intel Perşembe günü, özellikle engebeli bir geçmişe sahip olan ve 2015’te duyurulan bir makine olan Aurora süper bilgisayarı için 10.624 kanadın tamamını kurduklarını söyledi. Sistem, onbinlerce Xeon Max “Sapphire Rapids” CPU dizisini paket halinde HBM2E belleğe ve Data Center GPU Max “Ponte Vecchio” hesaplama GPU’larına kullanarak 2 FP64 ExaFLOPS üzerinden en yüksek teorik bilgi işlem performansını sunmayı vaat ediyor. Sistem bu yıl içinde devreye girecek.

Intel kurumsal başkan yardımcısı ve Super Compute Group genel müdürü Jeff McVeigh, “Aurora, Intel’in Max Serisi GPU’sunun ilk dağıtımı, en büyük Xeon Max CPU tabanlı sistemi ve dünyadaki en büyük GPU kümesidir” dedi.

Aurora süper bilgisayarı, rakamlarla bile oldukça etkileyici görünüyor. Makine, geleneksel CPU beygir gücü gerektiren iş yükleri için 1,1 milyondan fazla çekirdeğe sahip 21.248 genel amaçlı işlemci ve AI ve HPC iş yüklerine hizmet edecek 63.744 bilgi işlem GPU’su tarafından desteklenmektedir. Aurora, CPU’lar tarafından kullanılan 1,36 PB paket içi HBM2E belleğe ve 19,9 PB DDR5 belleğe ve ayrıca Ponte Vecchi bilgi işlem GPU’ları tarafından taşınan 8,16 PB HBM2E’ye sahiptir.

Aurora makinesi, her biri 66 bıçak barındıran 166 raf kullanır. Sekiz sıraya yayılıyor ve iki basketbol sahasına eşdeğer bir alanı kaplıyor. Bu arada, 220 TB depolama kapasitesi ve toplam 31 TB/s bant genişliği sunan 1.024 tamamen flash depolama düğümü kullanan Aurora’nın depolama alt sistemi bu sayıya dahil değildir. Şimdilik Argonne Ulusal Laboratuvarı, Aurora veya depolama altsistemi için resmi güç tüketimi rakamlarını yayınlamamaktadır.

Nükleer füzyon simülasyonlarından tahmine ve aerodinamikten tıbbi araştırmaya kadar çok çeşitli iş yükleri için kullanılacak olan süper bilgisayar, Slingshot ara bağlantılarına sahip HPE’nin Shasta süper bilgisayar mimarisini kullanıyor. Bu arada, sistem ANL’nin kabul testlerini geçmeden önce, büyük ölçekli bilimsel üretken AI modelleri için kullanılacaktır.

Kabul testi için çalışırken, bilim için bazı büyük ölçekli açık kaynaklı üretken yapay zeka modellerini eğitmek için Aurora’yı kullanacağız.” dedi Argonne Ulusal Laboratuvarı yardımcı laboratuvar direktörü Rick Stevens. “60.000’den fazla Intel Max GPU’su, çok hızlı G/Ç sistemi ve tamamen katı hal yığın depolama sistemi ile Aurora, bu modelleri eğitmek için mükemmel bir ortam.

Aurora bıçakları takılmış olsa da, süper bilgisayarın yine de süper bilgisayarlar için yaygın bir prosedür olan bir dizi kabul testinden geçmesi ve geçmesi gerekiyor. Bunları başarılı bir şekilde temizledikten ve yıl içinde çevrimiçi duruma geldiğinde, 2 ExaFLOPS’u (saniyede iki milyar milyar kayan nokta işlemi) aşan bir teorik performansa ulaşacağı tahmin edilmektedir. Geniş performansıyla Top500 listesinde üst sıralarda yer alması bekleniyor.

Aurora süper bilgisayarının kurulumu birkaç dönüm noktasına işaret ediyor: 2 ExaFLOPS’tan daha yüksek performansa sahip endüstrinin ilk süper bilgisayarı ve Intel’ tabanlı ilk ExaFLOPS sınıfı makine. Son olarak, sekiz yıl önce süper bilgisayarın yolculuğu tümseklerden payını aldığında başlayan Aurora destanının sonunu işaret ediyor.

İlk olarak 2015’te piyasaya sürülen Aurora’nın başlangıçta Intel’in Xeon Phi yardımcı işlemcileri tarafından desteklenmesi amaçlanmıştı ve 2018’de yaklaşık 180 PetaFLOPS sağlaması bekleniyordu. 2021 yılına kadar bir ExaFLOPS sistemi sağlamak için Argonne Ulusal Laboratuvarı ile anlaşmayı yeniden müzakere etmek.

Sistemin teslimatı, Intel’in 7 nm (artık Intel 4 olarak biliniyor) üretim düğümünün gecikmesi ve TSMC’nin N5 (5 nm sınıfı) için döşemeyi yeniden tasarlama gerekliliği nedeniyle Ponte Vecchio’nun bilgi işlem döşemesindeki zorluklar nedeniyle daha da ertelendi. işlem teknolojisi. Intel nihayet Veri Merkezi GPU Max ürünlerini geçen yılın sonlarında tanıttı ve şimdi bu bilgi işlem GPU’larından 60.000’den fazlasını ANL’ye gönderdi.

Giriş Yap

Gerçekçi Haber ayrıcalıklarından yararlanmak için hemen giriş yapın veya hesap oluşturun, üstelik tamamen ücretsiz!