Czy zabicie p┼éyt g┼é├│wnych mo┼╝e zwi─Ökszy─ç wydajno┼Ť─ç komputera?

Ta strona mo┼╝e zarabia─ç prowizje partnerskie z link├│w na tej stronie. Warunki korzystania. Czy zabicie p┼éyt g┼é├│wnych mo┼╝e zwi─Ökszy─ç wydajno┼Ť─ç komputera? 1Jednym z temat├│w, do kt├│rego powracali┼Ťmy wielokrotnie w ExtremeTech, jest trudno┼Ť─ç skalowania wydajno┼Ťci zar├│wno procesor├│w, jak i procesor├│w graficznych. Producenci p├│┼éprzewodnik├│w na ca┼éym ┼Ťwiecie zmagaj─ů si─Ö z tym problemem, podobnie jak projektanci CPU i GPU. Do tej pory nie by┼éo cudownych lekarstw ani ┼éatwych rozwi─ůza┼ä tego problemu, ale firmy zwr├│ci┼éy si─Ö do szerokiej gamy alternatywnych podej┼Ť─ç, aby pom├│c im w zwi─Ökszeniu podstawowej wydajno┼Ťci p├│┼éprzewodnik├│w, w tym nowych rodzaj├│w technologii pakowania. HBM, chiplety, a nawet technologie, takie jak nowy interkonekt 3D Intela, Foveros, s─ů cz─Ö┼Ťci─ů szeroko zakrojonych wysi┼ék├│w bran┼╝owych zmierzaj─ůcych do znalezienia nowych sposob├│w ┼é─ůczenia uk┼éad├│w, a nie skupiaj─ů si─Ö wy┼é─ůcznie na zmniejszaniu uk┼éad├│w.

Teraz para badaczy twierdzi, ┼╝e nadszed┼é czas, aby p├│j┼Ť─ç o krok dalej i ca┼ékowicie zrzuci─ç p┼éytk─Ö drukowan─ů. W artykule dla IEEE Spectrum Puneet Gupta i Subramanian S. Iyer pisz─ů, ┼╝e nadszed┼é czas, aby zast─ůpi─ç PCB samym krzemem i wyprodukowa─ç ca┼ée systemy na jednym waflu. Je┼Ťli ten argument brzmi znajomo, to dlatego, ┼╝e ta para jest dwoma autorami artyku┼éu, kt├│ry om├│wili┼Ťmy na pocz─ůtku tego roku na temat zalet przetwarzania waflowego dla procesor├│w graficznych przy u┼╝yciu technologii po┼é─ůcze┼ä, kt├│r─ů opracowali jako Si-IF – Silicon Interconnect Fabric.

Przetwarzanie w skali waflowej polega na wykorzystaniu ca┼éego krzemowego wafla do zbudowania jednej ogromnej cz─Ö┼Ťci – w tym przypadku GPU. Praca zespo┼éu badawczego wykaza┼éa, ┼╝e ÔÇőÔÇőjest to dzi┼Ť potencjalnie op┼éacalne podej┼Ťcie pod wzgl─Ödem wydajno┼Ťci, wydajno┼Ťci i zu┼╝ycia energii, przy lepszych wynikach ni┼╝ mo┼╝na by oczekiwa─ç po zbudowaniu r├│wnowa┼╝nej liczby oddzielnych uk┼éad├│w GPU przy u┼╝yciu konwencjonalnych technik produkcji. W artykule para zwraca uwag─Ö na wiele problem├│w zwi─ůzanych z utrzymywaniem p┼éyt g┼é├│wnych w pierwszej kolejno┼Ťci, zaczynaj─ůc od potrzeby zamontowania faktycznego fizycznego uk┼éadu w pakiecie do 20x wi─Ökszym ni┼╝ procesor. W ko┼äcu matryca procesora jest zwykle znacznie mniejsza ni┼╝ fizyczne pod┼éo┼╝e, na kt├│rym jest zamontowana.

Czy zabicie p┼éyt g┼é├│wnych mo┼╝e zwi─Ökszy─ç wydajno┼Ť─ç komputera? 2

Schemat: Brandon Palacio dla IEEE Spectrum

Autorzy twierdz─ů, ┼╝e u┼╝ycie fizycznych pakiet├│w dla uk┼éad├│w scalonych (tak jak robimy to, gdy montujemy je na p┼éytce drukowanej) zwi─Öksza odleg┼éo┼Ť─ç, kt├│r─ů sygna┼éy mi─Ödzy uk┼éadami musz─ů pokona─ç 10-krotnie, tworz─ůc gigantyczn─ů pr─Ödko┼Ť─ç i w─ůskie gard┼éo pami─Öci. Jest to cz─Ö┼Ť─ç problemu z tak zwan─ů ÔÇ×┼Ťcian─ů pami─ÖciÔÇŁ – zegary i wydajno┼Ť─ç pami─Öci RAM wzros┼éy znacznie wolniej ni┼╝ wydajno┼Ť─ç procesora, cz─Ö┼Ťciowo z powodu konieczno┼Ťci po┼é─ůczenia pami─Öci w pewnej fizycznej odleg┼éo┼Ťci od pakietu procesora. Jest to r├│wnie┼╝ cz─Ö┼Ť─ç tego, dlaczego HBM jest w stanie zapewni─ç tak ogromn─ů przepustowo┼Ť─ç pami─Öci – przeniesienie pami─Öci bli┼╝ej procesora pozwala na znacznie szersze ┼Ťcie┼╝ki sygna┼éu. Pakowane ┼╝etony s─ů r├│wnie┼╝ trudniejsze do utrzymania w ch┼éodzie. Dlaczego to wszystko robimy? Poniewa┼╝ wymagaj─ů tego PCB.

Ale wed┼éug dw├│ch badaczy krzemowe po┼Ťrednicz─ůce i podobne technologie s─ů zasadniczo niew┼éa┼Ťciwymi ┼Ťcie┼╝kami. Zamiast tego proponuj─ů procesory ┼é─ůcz─ůce, pami─Ö─ç, analog, RF i wszystkie inne chiplety bezpo┼Ťrednio na waflu. Zamiast uderze┼ä lutowia chipy u┼╝ywa┼éyby miedzianych s┼éupk├│w w skali mikrometra umieszczonych bezpo┼Ťrednio na krzemowym pod┼éo┼╝u. Chipowe porty I / O by┼éyby bezpo┼Ťrednio zwi─ůzane z pod┼éo┼╝em za pomoc─ů kompresji termicznej w wi─ůzaniu miedzi z miedzi─ů. Radiatory mog─ů by─ç umieszczone po obu stronach Si-IF w celu ┼éatwiejszego ch┼éodzenia produkt├│w, a krzem jest lepszym przewodnikiem ciep┼éa ni┼╝ PCB.

Czy zabicie p┼éyt g┼é├│wnych mo┼╝e zwi─Ökszy─ç wydajno┼Ť─ç komputera? 3

Sama trudno┼Ť─ç obecnego skalowania stanowi w┼éasny argument za badaniem takich pomys┼é├│w. Stara mantra Prawa / Skalowania Dennarda ÔÇ×Moore, szybciej, taniejÔÇŁ ju┼╝ nie dzia┼éa. Jest ca┼ékiem mo┼╝liwe, ┼╝e zast─ůpienie p┼éytek PCB lepszym pod┼éo┼╝em mo┼╝e pozwoli─ç na znacznie lepsze skalowanie wydajno┼Ťci, przynajmniej w niekt├│rych scenariuszach. Systemy na skal─Ö waflow─ů by┼éyby o wiele za drogie, aby instalowa─ç je w dowolnym domu, ale mog┼éyby zasila─ç serwery przysz┼éo┼Ťci. Firmy takie jak Microsoft, Amazon, a Google obstawia miliardy na pomys┼é, ┼╝e nast─Öpna fala wysokowydajnych komputer├│w b─Ödzie oparta na chmurze, a gigantyczne komputery oparte na waflach mog─ů znale┼║─ç szcz─Ö┼Ťliwy dom w przemys┼éowych bazach danych. W oparciu o wyniki test├│w GPU, kt├│re om├│wili┼Ťmy na pocz─ůtku tego roku, wydaje si─Ö, ┼╝e pomys┼é jest uzasadniony. Powy┼╝szy wykres z pracy z kart─ů graficzn─ů pokazuje op├│┼║nienie, szeroko┼Ť─ç pasma i zapotrzebowanie na energi─Ö do integracji w skali op┼éatkowej w por├│wnaniu do konwencjonalnych metod.

Wydajno┼Ť─ç to nie jedyny pow├│d, dla kt├│rego istnieje komputer

Wa┼╝ne jest r├│wnie┼╝, aby uzna─ç, ┼╝e ekosystem komputera nie w┼éa┼Ťnie istniej─ů, aby poprawi─ç wydajno┼Ť─ç. Komputery zosta┼éy zaprojektowane tak, aby by┼éy elastyczne i modu┼éowe, aby u┼éatwi─ç korzystanie z nich w r├│┼╝nych okoliczno┼Ťciach. Mam starsz─ů maszyn─Ö z procesorem X79 z ograniczon─ů liczb─ů port├│w USB 3.0. Wiele lat temu postanowi┼éem uzupe┼éni─ç ten skromny numer czteroportow─ů kart─ů USB 3.0. Je┼Ťli m├│j procesor GPU wymaga aktualizacji, aktualizuj─Ö j─ů – nie kupuj─Ö ca┼ékowicie nowego systemu. Je┼Ťli moja p┼éyta g┼é├│wna ulegnie awarii, teoretycznie mog─Ö zamieni─ç si─Ö na inn─ů p┼éyt─Ö. Awaria pami─Öci RAM oznacza wyrzucenie pami─Öci DDR3 i wrzucenie nowej, a nie wymian─Ö cz─Ö┼Ťci hurtowych. Ta elastyczno┼Ť─ç podej┼Ťcia jest jednym z powod├│w, dla kt├│rych komputery PC spad┼éy i dlaczego platforma mo┼╝e by─ç u┼╝ywana do tak wielu r├│┼╝nych zada┼ä.

Autorzy wykonuj─ů godn─ů pochwa┼éy prac─Ö, przedstawiaj─ůc zar├│wno zalety, jak i wady przyj─Öcia rozwi─ůzania Si-IF do produkcji p├│┼éprzewodnik├│w, a artyku┼é, cho─ç d┼éugi, jest absolutnie wart przeczytania. Zauwa┼╝aj─ů, ┼╝e firmy musia┼éyby projektowa─ç nadmiarowe systemy na poziomie p┼éytek, aby zapewni─ç, ┼╝e wszelkie awarie in situ zosta┼éy ograniczone do absolutnego minimum. Ale w tej chwili ca┼éa bran┼╝a p├│┼éprzewodnik├│w jest mniej lub bardziej ukierunkowana w przeciwnym kierunku ni┼╝ ten pomys┼é. Na przyk┼éad nadal mo┼╝na kupi─ç system z procesorami AMD i procesorami graficznymi Nvidia, ale zale┼╝y to od bezprecedensowej wsp├│┼épracy mi─Ödzy odlewni─ů klient├│w (TSMC, Samsung lub GlobalFoundries) a dwoma r├│┼╝nymi klientami.

Podejrzewam, ┼╝e mogliby┼Ťmy zobaczy─ç firmy rozwa┼╝aj─ůce tego typu rozbudow─Ö w perspektywie d┼éugoterminowej, ale nie spodziewa┼ébym si─Ö, ┼╝e kiedykolwiek zast─ůpi─Ö bardziej konwencjonalny ekosystem komputer├│w. Korzy┼Ťci z mo┼╝liwo┼Ťci rozbudowy i elastyczno┼Ťci s─ů ogromne, podobnie jak ekonomia skali, kt├│r─ů te mo┼╝liwo┼Ťci wsp├│lnie tworz─ů. Ale dostawcy du┼╝ych centr├│w danych mog─ů wybra─ç to podej┼Ťcie w d┼éugim okresie, je┼Ťli przyniesie ono rezultaty. Samo prawo Moore'a nie dostarczy odpowiedzi, kt├│rych szukaj─ů firmy. Pozbycie si─Ö p┼éyt g┼é├│wnych to radykalny pomys┼é – ale je┼Ťli zadzia┼éa i da si─Ö to zrobi─ç w przyst─Öpnej cenie, kto┼Ť prawdopodobnie spr├│buje.

Teraz przeczytaj: