Większość naszej oferty procesorów graficznych skupia się na stronie konsumenckiej firmy i testowaniu gier, ale obiecałem zbadać obliczeniową wydajność już w momencie premiery Radeona VII. Niedawno zadebiutował model 5700 XT, mieliśmy okazję powrócić do tego pytania dzięki nowej architekturze GPU firmy AMD i porównać RDNA z GCN.
W rzeczywistości ogólna sytuacja obliczeniowa znajduje się na ciekawym skrzyżowaniu. AMD oświadczyło, że chce być poważniejszym graczem w środowiskach obliczeniowych dla przedsiębiorstw, ale także powiedział, że GCN będzie nadal istniał obok RDNA w tej przestrzeni. Radeon VII to konsumencka odmiana akceleratora MI50 AMD z obsługą prędkości FP64 przy połowie prędkości. Jeśli wiesz, że potrzebujesz na przykład obliczeń FP64 o podwójnej precyzji, Radeon VII wypełnia tę niszę w sposób, jakiego nie robi żaden inny procesor graficzny w tym porównaniu.
Radeon VII ma najwyższą przepustowość pamięci RAM i jest to jedyny procesor graficzny w tym porównaniu, który oferuje znacznie większą wydajność podwójnej precyzji. Ale chociaż te układy GPU mają stosunkowo podobne specyfikacje w formie papierowej, istnieją znaczne różnice między nimi pod względem wydajności – a liczby nie zawsze zmieniają się tak, jak myślisz.
Jeden z głównych punktów rozmów AMD z 5700 XT jest teraz Navi reprezentuje zasadniczo nową architekturę GPU. 5700 XT okazał się być średnio szybszy niż Vega 64 w naszych testach po stronie konsumenta równania, ale chcieliśmy również sprawdzić sytuację w obliczeniach. Należy jednak pamiętać, że nowość 5700 XT również działa nieco przeciwko nam. Niektóre aplikacje mogą wymagać aktualizacji, aby w pełni wykorzystać ich możliwości.
Odnośnie Blendera 2.80
Nasze wyniki testów zawierają dane zarówno z Blendera 2.80, jak i samodzielnego testu porównawczego Blendera, 1.0beta2 (wydany w sierpniu 2018 r.). Blender 2.80 to główne wydanie aplikacji, które zawiera wiele istotnych zmian. Autonomiczny test porównawczy nie jest kompatybilny z rodziną RTX Nvidii, co wymagało testowania z najnowszą wersją oprogramowania. Początkowo testowaliśmy wersję beta Blendera 2.80, ale potem spadła ostateczna wersja – więc zrzuciliśmy wyniki wersji beta i ponownie przetestowaliśmy.
Zdjęcie wykonane przez Blender
Istnieją znaczące różnice w wydajności między testem porównawczym Blender 1.0beta2 a wersją 2.80, a jedna scena Classroom nie wyświetla się poprawnie w nowej wersji. Ta scena została usunięta z naszych porównań 2,80. Blender pozwala użytkownikowi określić rozmiar kafelka w pikselach, aby kontrolować, jak duża część sceny jest przetwarzana jednocześnie. Kod w plikach Pythona testu porównawczego Blender 1.0beta2 wskazuje, że w teście używa się kafelków o wielkości 512 × 512 (współrzędne X / Y) dla procesorów graficznych i 16 × 16 dla procesorów. Większość plików scen faktycznie zawartych w teście porównawczym, jednak faktycznie używa domyślnego rozmiaru kafelka 32 × 32, jeśli jest załadowany w Blenderze 2.80.
Testowaliśmy Blender 2.80 w dwóch różnych trybach. Najpierw przetestowaliśmy wszystkie kompatybilne sceny, używając domyślnego rozmiaru kafelków, w których załadowano sceny. Było to 16 × 16 dla Barbershop_Interior i 32 × 32 dla wszystkich innych scen. Następnie przetestowaliśmy te same rendery z domyślnym rozmiarem kafelków 512 × 512. Do tej pory reguła dotycząca rozmiarów kafelków była taka, że większe rozmiary były dobre dla procesorów graficznych, podczas gdy mniejsze rozmiary były dobre dla procesorów. Wygląda na to, że nieco się zmieniło w Blenderze 2.80. Procesory graficzne AMD i Nvidia wykazują bardzo różne reakcje na większe rozmiary kafelków, przy czym procesory graficzne AMD przyspieszają przy większych rozmiarach kafelków, a procesory graficzne Nvidia tracą wydajność.
Ponieważ pliki scen, które testujemy, zostały utworzone w starszej wersji Blendera, możliwe, że może to wpłynąć na nasze ogólne wyniki. Od kilku tygodni intensywnie współpracujemy z AMD, aby zbadać aspekty wydajności Blendera w procesorach graficznych GCN. GCN, Pascal, Turing i RDNA wykazują inny wzór wyników przy przejściu z 32 × 32 na 512 × 512, przy czym Turing traci mniejszą wydajność niż Pascal i RDNA, osiągając większą wydajność w większości przypadków niż GCN.
Wszystkie nasze procesory graficzne znacznie skorzystały nie przy użyciu kafelka o rozmiarze 16 × 16 dla Barbershop_Interior. Chociaż domyślnie ten test to 16 × 16, nie renderuje się on dobrze przy tym rozmiarze kafelka na żadnym GPU.
Rozwiązywanie problemów z różnymi wynikami, które widzieliśmy w teście porównawczym Blender 1.0Beta2 w porównaniu z wersją beta Blender 2.80, a na końcu Blender 2.80 final przechowywał tę recenzję przez kilka tygodni i pracowaliśmy nad kilkoma sterownikami AMD. Wszystkie nasze wyniki Blendera 2.80 były zatem uruchamiane przy użyciu Adrenaline 2019 Edition 19.8.1.
Konfiguracja testu i uwagi
Wszystkie procesory graficzne zostały przetestowane na systemie Intel Core i7-8086K przy użyciu płyty głównej Asus Prime Z370-A. Vega 64, Radeon RX 5700 XT i Radeon VII zostały przetestowane przy użyciu Adrenalin 2019 Edition 19.7.2 (7/16/2019) do wszystkiego ale Blender 2.80. Wszystkie testy Blendera 2.80 zostały uruchomione przy użyciu 19.8.1, a nie 19.7.2. Zarówno Nvidia GeForce GTX 1080, jak i Gigabyte Aorus RTX 2080 zostały przetestowane przy użyciu sterownika Nvidia 431.60 Game Ready (7/23/2019).
CompuBench 2.0 uruchamia procesory graficzne przez serię testów mających na celu pomiar różnych aspektów ich wydajności obliczeniowej. Jednak wydaje się, że Kishonti, twórcy CompuBench, nie przedstawiają żadnego znaczącego podziału na to, jak zaprojektowali swoje testy. Symulacja zestawu poziomów może odnosić się do używania zestawów poziomów do analizy powierzchni i kształtów. Catmull-Clark Subdivision to technika stosowana do tworzenia gładkich powierzchni. Symulacje ciał N to symulacje dynamicznych układów cząstek pod wpływem sił takich jak grawitacja. Przepływ optyczny TV-L1 jest implementacją metody szacowania przepływu optycznego stosowanej w wizji komputerowej.
SPEC Workstation 3.1 zawiera wiele takich samych obciążeń, jak SPECViewPerf, ale ma także dodatkowe obciążenia obliczeniowe na GPU, które rozdzielimy osobno. Pełny podział testu stacji roboczej i pakietu aplikacji można znaleźć tutaj. Stacja robocza SPEC 3.1 została uruchomiona w natywnym trybie testowym 4K. Chociaż ten test nie został przesłany do SPEC w celu oficjalnej publikacji, nasze testy SPEC Workstation 3.1 były zgodne z ustalonymi przez organizację zasadami testowania, które można znaleźć tutaj.
Procesory graficzne Nvidia zawsze były testowane z CUDA, gdy CUDA była dostępna.
Przygotowaliśmy dla Ciebie dwa zestawy wyników – syntetyczną serię testów porównawczych utworzonych za pomocą SiSoft Sandra i badającą różne aspekty porównania tych układów, w tym moc przetwarzania, opóźnienie pamięci i cechy wewnętrzne oraz szerszy zestaw testów, które dotknąć wydajności obliczeniowej i renderowania w różnych aplikacjach. Ponieważ testy SiSoft Sandra 2020 są unikalne dla tej aplikacji, zdecydowaliśmy się podzielić je na ich własny pokaz slajdów.
Wyniki Gigabyte Aorus RTX 2080 należy odczytywać jako w przybliżeniu równoważne z RTX 2070S. Oba procesory graficzne działają prawie identycznie w obciążeniach konsumenckich i powinny również do siebie pasować również na stacji roboczej.
SiSoft Sandra 2020
SiSoft Sandra to uniwersalne narzędzie do informacji o systemie oraz w pełni wyposażony pakiet do oceny wydajności. Chociaż jest to test syntetyczny, jest to prawdopodobnie najbardziej wszechstronne narzędzie oceny syntetycznej, a Adrian Silasi, jego programista, spędził dekady doskonaląc go i ulepszając, dodając nowe funkcje i testy w miarę ewolucji procesorów i układów GPU.
Nasze wyniki specyficzne dla SiSoft Sandra są poniżej. Niektóre z naszych wyników OpenCL są nieco dziwne, jeśli chodzi o 5700 XT, ale według Adriana nie miał on jeszcze okazji zoptymalizować kodu do wykonania na 5700 XT. Uważaj te wyniki za wstępne – interesujące, ale być może jeszcze nie orientacyjne – w odniesieniu do tego GPU.
Nasze testy porównawcze SiSoft Sandra 2020 wskazują w dużej mierze w tym samym kierunku. Jeśli potrzebujesz zmiennoprzecinkowej podwójnej precyzji, Radeon VII jest potworem obliczeniowym. Chociaż nie jest jasne, ilu kupujących należy do tej kategorii, istnieją pewne miejsca, takie jak przetwarzanie obrazu i bardzo precyzyjne obciążenia, w których Radeon VII świeci.
Oparty na RDNA Radeon 5700 XT robi mniej, aby wyróżnić się w tych testach, ale jesteśmy również w kontakcie z Silasi w sprawie problemów, które napotkaliśmy podczas testów. Ulepszone wsparcie może zmienić niektóre z tych wyników w nadchodzących miesiącach.
Wyniki testów
Teraz, gdy zajęliśmy się wydajnością Sandry, przejdźmy do reszty naszego pakietu testów porównawczych. Nasze pozostałe wyniki znajdują się w pokazie slajdów poniżej:
Wnioski
Co mówią nam te wyniki? Wiele raczej interesujących rzeczy. Po pierwsze, RDNA jest wręcz imponujące. Pamiętaj, że przetestowaliśmy ten procesor graficzny w profesjonalnych i zorientowanych na obliczenia aplikacjach, z których żadna nie została zaktualizowana ani załatana, aby na nim działać. Istnieją wyraźne oznaki, że wpłynęło to na nasze wyniki testów porównawczych, w tym niektóre testy, które albo nie chciały się uruchomić, albo działały wolno. Mimo to 5700 XT robi wrażenie.
Radeon VII robi wrażenie zbyt, ale na różne sposoby niż 5700 XT. SiSoft Sandra 2020 pokazuje przewagę, jaką ta karta może przynieść do zadań o podwójnej precyzji, gdzie oferuje znacznie większą wydajność niż cokolwiek innego na rynku. Sztuczna inteligencja i uczenie maszynowe stały się ostatnio znacznie ważniejsze, ale jeśli pracujesz w obszarze, w którym podwójna precyzja GPU jest kluczowa, Radeon VII ma ogromną siłę ognia. SiSoft Sandra zawiera testy oparte na D3D11 zamiast na OpenCL. Ale biorąc pod uwagę, że OpenCL jest głównym konkurentem dla CUDA, zdecydowałem się go trzymać we wszystkich przypadkach, z wyjątkiem testów opóźnień pamięci, które globalnie wykazały niższe opóźnienia dla wszystkich procesorów graficznych, gdy zastosowano D3D w porównaniu z OpenCL.
W testach stacji roboczych, takich jak SPEC Workstation 3.1, Radeon 5700 XT ogólnie przewyższa Vegę 64. Jest to pod wieloma względami bliższe porównanie dla Radeona VII, pomimo niedojrzałości sterownika, mniejszej przepustowości pamięci i mniejszej pamięci RAM. Ta rodzina GPU powinna mieć potencjał na rynku stacji roboczych, przynajmniej długoterminowo.
AMD wcześniej powiedział, że zamierza utrzymać GCN na rynku obliczeń, z Navi zorientowanym na rynek konsumencki, ale nic nie wskazuje na to, że firma zamierza kontynuować ewolucję GCN na innej drodze niż RDNA. Bardziej prawdopodobne jest to, że GCN nie zostanie zastąpiony na szczycie rynku komputerowego, dopóki Big Navi nie będzie gotowy w pewnym momencie w 2020 roku. Na podstawie tego, co widzieliśmy, na tym froncie jest wiele powodów do ekscytacji . Istnieją już aplikacje, w których RDNA jest znacznie szybszy niż Radeon VII, pomimo ogromnej różnicy między kartami pod względem możliwości podwójnej precyzji, przepustowości pamięci RAM i pojemności pamięci.
Blender 2.80 przedstawia interesującą serię porównań między RDNA, GCN i CUDA. Korzystanie z większych rozmiarów kafelków ma ogromny wpływ na wydajność GPU, ale to, czy ta różnica jest dobra czy zła, zależy od tego, jakiej marki GPU używasz i do której rodziny architektonicznej należy. Procesory graficzne Pascal i Turing działały lepiej przy mniejszych rozmiarach płytek, podczas gdy procesory graficzne GCN działały lepiej z większymi. Rozmiar płytki 512 × 512 był lepszy w sumie dla wszystkich układów GPU, ale tylko dlatego, że poprawiło całkowity czas renderowania w Barbershop_Interior o więcej niż zaszkodziło czasowi renderowania każdej innej sceny dla układów GPU Turing i Pascal. RTX 2080 był najszybszym GPU w naszych testach porównawczych Blendera, ale 5700 XT ogólnie zapewnia doskonałe wyniki.
Nie chcę wypowiadać się globalnie na temat ustawień Blendera 2.80; Nie jestem ekspertem od renderowania 3D. Te wyniki testu sugerują, że Blender działa lepiej z większymi ustawieniami kafelków na GPU AMD, ale mniejsze ustawienia kafelków mogą dawać lepsze wyniki dla GPU Nvidia. W przeszłości zarówno procesory graficzne AMD, jak i Nvidia korzystały z większych rozmiarów płytek. Ten wzorzec można jednak również powiązać z konkretnymi scenami, o których mowa. Jeśli korzystasz z Blendera, sugeruję eksperymentowanie z różnymi scenami i rozmiarami kafelków.
Ostatecznie te wyniki sugerują, że na niektórych z tych profesjonalnych rynków występuje więcej różnic w wydajności GPU, niż możemy się spodziewać w przypadku gier. Istnieją specjalne testy, w których 5700 XT jest znacznie szybszy niż RTX 2080 lub Radeon VII, a inne testy, w których gwałtownie ustępuje. Niedojrzałość sterownika OpenCL może być tego przyczyną, ale widzimy przebłyski jasności w tych wynikach. Podwójna precyzja działania Radeona VII stawia go pod pewnymi względami w swojej klasie, ale Radeon RX 5700 XT jest znacznie tańszą i cichszą kartą. W zależności od docelowej aplikacji nowy procesor AMD 400 USD może być najlepszym wyborem na rynku. W innych scenariuszach zarówno Radeon VII, jak i RTX 2080 twierdzą, że jest najszybszą dostępną kartą.
Obraz funkcji jest ostatecznym renderowaniem sceny Benchmark_Pavilion zawartej w niezależnym teście Blendera 1.02beta.
Aktualizacja (27.08.2019): Test porównawczy SPEC Workstation 3.1 nie powiadamia użytkownika, jeśli test spadnie do niższej rozdzielczości wyjściowej niż podana. Spowodowało to, że nasze oryginalne wyniki 5700 XT były uruchamiane w niższej rozdzielczości niż zamierzony test 4K. Te wykresy zostały zaktualizowane o wyniki sprawdzone w 4K. 5700 XT nadal oferuje imponującą wydajność w tych trybach, choć nie dość, że nie pęka na niebie tak, jak to początkowo sądziliśmy. ET żałuje błędu.
Teraz przeczytaj: