Cerebras Systems przedstawia 1,2-bilionowy tranzystorowy procesor waflowy do sztucznej inteligencji

Ta strona może zarabiać prowizje partnerskie z linków na tej stronie. Warunki korzystania. Cerebras Systems przedstawia 1,2-bilionowy tranzystorowy procesor waflowy do sztucznej inteligencji 1

Źródło: Getty Images

Współczesne liczby tranzystorów CPU są ogromne – AMD ogłosiło na początku tego miesiąca, że ​​pełna implementacja 7-nanometrowego procesora Epyc „Rome” waży 32 miliardy tranzystorów. Do tego Cerebras Technology mówi: „Trzymaj moje piwo”. Firma skupiona na sztucznej inteligencji opracowała silnik zwany Wafel Scale Engine. GPW jest kwadratem o wymiarach około ośmiu cali na dziewięć cali i zawiera w przybliżeniu 1,2 biliona tranzystorów.

Naprawdę jestem zaskoczony, gdy firma tak szybko wprowadza na rynek produkt waflowy. Idea przetwarzania waflowego zwróciła ostatnio uwagę jako potencjalne rozwiązanie problemów ze skalowaniem wydajności. W badaniu, które omawialiśmy na początku tego roku, naukowcy ocenili pomysł zbudowania ogromnej karty graficznej na większości lub wszystkich płytkach 100 mm. Odkryli, że technika ta może wytworzyć wydajne, wydajne procesory i że może również skutecznie skalować się do większych rozmiarów węzłów. Cerebras GPW zdecydowanie kwalifikuje się jako duży samochód ciężarowy – jego całkowita powierzchnia jest znacznie większa niż hipotetyczne projekty, które rozważaliśmy na początku tego roku. Nie jest pełnowymiarowym waflem 300 mm, ale ma większą powierzchnię niż 200 mm.

Największy procesor graficzny,SEEAMAZON_ET_135 Zobacz Amazon ET commerce dla porównania mierzy 815 milimetrów kwadratowych i pakuje tranzystory 21,1B. Cerebras GPW jest więc po prostu kawałek większe, jak te rzeczy idą. Niektóre firmy wysyłają zdjęcia swoich żetonów trzymanych obok małego wspólnego obiektu, na przykład ćwierć. Cerebras wysłał zdjęcie swojej kości obok klawiatury.

cerebras-1-100808712-duży

Brak zdjęcia: gniazdo PCIe x1600.

Jak widać, porównuje się dość dobrze.

Cerebras WSE zawiera 400 000 rzadkich rdzeni algebry liniowej, 18 GB całkowitej pamięci na matrycy, przepustowość pamięci o wartości 9PB / s na całym układzie i oddzielną przepustowość tkaniny do 100Pbit / s. Cały układ oparty jest na 16nm procesie FinFET TSMC. Ponieważ chip zbudowany jest z (większości) pojedynczego wafla, firma wdrożyła metody routingu wokół złych rdzeni na matrycy i może utrzymywać swoje tablice połączone, nawet jeśli ma złe rdzenie w części płytki. Firma twierdzi, że ma wbudowane nadmiarowe rdzenie na matrycy, choć nie omówiła jeszcze szczegółów. Szczegóły dotyczące projektu zostaną przedstawione w tym tygodniu na Hot Chips.

GPW – „CPU” po prostu nie wydaje się wystarczające – jest chłodzony za pomocą ogromnej zimnej płyty znajdującej się nad krzemem, z pionowo zamontowanymi rurami wodnymi służącymi do bezpośredniego chłodzenia. Ponieważ nie ma tradycyjnego opakowania na tyle dużego, aby zmieściło się w układzie, Cerebras zaprojektował własny. PCWorld opisuje to jako „połączenie płytki drukowanej, płytki, niestandardowego złącza łączącego je i zimnej płyty”. Szczegółowe informacje na temat układu, takie jak jego surowa wydajność i zużycie energii, nie są jeszcze dostępne.

W pełni funkcjonalny procesor waflowy, sprzedawany na dużą skalę, byłby ekscytującym pokazem, czy to podejście technologiczne ma jakiekolwiek znaczenie dla szerszego rynku. Chociaż nigdy nie będziemy sprzedawać komponentów konsumenckich w ten sposób, istnieje zainteresowanie wykorzystaniem przetwarzania waflowego w celu poprawy wydajności i zużycia energii na wielu rynkach. Jeśli konsumenci nadal przenoszą obciążenia do chmury, zwłaszcza obciążenia o wysokiej wydajności, takie jak gry, nie jest szalone, że pewnego dnia producenci GPU skorzystają z tego pomysłu – i zbudują tablice części, na które nikt nie mógłby pozwolić sobie na zasilenie chmury systemy do gier w przyszłości.

Teraz przeczytaj: