GIGABYTE RTX 20 Series SUPER GAMING OC GPUs Review - NVIDIA Turing Features

Σελίδα 2 από 8: NVIDIA Turing Features

 

 

  

Η Turing αρχιτεκτονική της NVIDIΑ βρίσκεται στην αγορά για πάνω από έναν χρόνο, με το πρώτο μοντέλο να είναι η RTX 2080 με την RTX 2070 για τη high end αγορά και την εισαγωγική κάρτα της κατηγορίας αντίστοιχα. Μετά από το καλοκαίρι του 2019 όμως η εταιρία προχώρησε σε μερικές προσθήκες, ανανεώνοντας ολόκληρο το lineup με τις SUPER, νέες Turing κάρτες που φέρουν ελαφρώς περισσότερους CUDA πυρήνες από τις πρώτες υλοποιήσεις και παρουσιάζουν ελαφρώς βελτιωμένες επιδόσεις. Ακολουθεί το αρχικό κείμενο της Turing αρχιτεκτονικής που αναφέρει πολλές από τις ίδιες τεχνολογίες που συναντάμε και στις SUPER.

 

Die shot του μεγάλου πυρήνα Turing TU102.

dieshothwbox

 

 

 

Τα έξτρα execution units που προστίθενται στην Turing δικαιολογούν την αύξηση στο μέγεθος των πυρήνων από την γενιά των Pascal. Ήδη κοιτάζοντας τους αντίστοιχους πυρήνες των δύο γενιών βλέπουμε σημαντικές αλλαγές στο μέγεθος των πυρήνων που πηγάζουν από τα νέα execution units που θα δούμε στη πορεία.

 

 

tu104 diagram

 

 

 

Είναι επίσης σημαντικό να τονίσουμε ότι η 2080 Ti που είναι η κορυφαία Turing δε διαθέτει τον πλήρη Turing πυρήνα των 4608 CUDA cores αλλά περιλαμβάνει 4302 πυρήνες, κάτι που σημαίνει πως η NVIDIA ίσως έχει στα σκαριά και κάποια νέα TITAN GPU με Turing αρχιτεκτονική στο μέλλον σ.σ. ή πλέον με την έλευση των SUPER θα δούμε μια 'πλήρη' RTX 2080 Ti SUPER με τον ίδιο πυρήνα της RTX TITAN. Σε κάθε Streaming Multiprocessor των 64 CUDA cores βλέπουμε την προσθήκη τεσσάρων INT32 μονάδων και έτσι η GPU θα μπορεί να τρέξει παράλληλα floating point και non floating point εργασίες που σημαίνει, θεωρητική αύξηση τις επιδόσεις μέχρι και 35% σε αρκετά σενάρια. ‘Δίπλα’ στο κομμάτι του κλασικού compute που έχει μειωθεί στο μισό από την γενιά Pascal υπάρχουν και οι πυρήνες Tensor και συνολικά υπάρχουν τέσσερις σε κάθε SM που παράλληλα κλείνει με έναν Ray Tracing πυρήνα ενώ οι L1 cache του κάθε SM διπλασιάζουν το bandwidth τους υιοθετώντας μια πιο unified σχεδίαση και πιο άμεσο access των resources, ένα εξίσου σημαντικό στοιχείο που αλλάζει στην Turing αρχιτεκτονική. Μένοντας στις cache, η L2 γίνεται ακόμη ταχύτερη ενώ διπλασιάζεται στα μεγάλα μοντέλα με τον πυρήνα TU102 σε σχέση με τον GP102 όπως αυτόν της TITAN Xp, πηγαίνοντας στα 6MByte.

 

sm diagram

 

Νέες Shading τεχνικές και καλύτερο memory compression θα είναι και αυτά ανάμεσα στα νέα features της νέας γενιάς που θα επιτρέψουν μεγαλύτερο αριθμό αντικειμένων σε κάθε σκηνή ενώ με την shader limiting τεχνική ο developer θα μπορεί να μειώσει τον ρυθμό του shading, εάν δεν προσφέρει κάτι στην ποιότητα της εικόνας. Οι μνήμες τύπου GDDR6 αποτελούν φυσική εξέλιξη των GDDR5X που ανέπτυξε σε συνεργασία με τις μεγάλες εταιρίες στον χώρο των μνημών και βρίσκονται σε κάθε νέα RTX GPU της NVIDIA. Σε σχέση με την προηγούμενη γενιά υπάρχουν βελτιώσεις στην καθαρότητα του σήματος που πηγάζουν από την νέα λιθογραφία, την θερμοκρασία αλλά και την τάση λειτουργίας των chips, αυξάνοντας τόσο το power efficiency αλλά και το bandwidth στα 14Gbps. Ωστόσο, στα του overclocking περιμένουμε εξίσου μεγάλη αύξηση των επιδόσεων απλά υπερχρονίζοντας τις μνήμες των καρτών, αυξάνοντας το power limit και χωρίς να πειράξουμε το core clock.

 

 

Ray Tracing

Το ray tracing είναι μια ιδιαίτερα απαιτητική διεργασία από επεξεργαστικής ισχύος και έχει να κάνει με το simulation των ακτίδων φωτός σε ένα καρέ μιας 3D εφαρμογής το οποίο πραγματοποιείται για πρώτη φορά σε πραγματικό χρόνο στις Turing κάρτες γραφικών. Για χρόνια η NVIDIA διέθετε σε επαγγελματίες τα κλασικά Iray plugins και την μηχανή OptiX για ray tracing, όμως ένα βασικό μειονέκτημά τους ήταν το υψηλής ποιότητας rendering σε πραγματικό χρόνο το οποίο δεν ήταν μέχρι πρότινος δυνατό. Ακόμη και στις Volta GPUs, το real time ray tracing απουσιάζει στη μονή GPU. Αυτό μας οδηγεί στην Hybrid Rendering Pipeline που θα ενσωματώνουν οι νέες GPUs της NVIDIA. Πρακτικά οι Turing GPUs πραγματοποιούν rasterization και ray tracing τεχνικές εκεί όπου χρειάζεται προσφέροντας έτσι το καλύτερο δυνατό οπτικό αποτέλεσμα, ειδικά εάν το παιχνίδι το υποστηρίζει. Εδώ εντοπίζεται και το μεγαλύτερο μειονέκτημα των GPUs, η υποστήριξη του NVIDIA Ray Tracing σε υπάρχοντα παιχνίδια καθώς και η απουσία του από το DirectX 12 μιας και είναι εντελώς proprietary και θα χρησιμοποιείται απευθείας σε συνεργασία με τον developer με τα εργαλεία που έχει ήδη διαθέσιμα σε αυτούς.

 

Η ακολουθία που πραγματοποιείται στο ray tracing κομμάτι για τις αντανακλάσεις και τις διαθλάσεις, και του rasterization για το κομμάτι των textures.

ray tracing scheduling

 

 

Η NVIDIA για άλλη μια χρονιά αναφέρεται εκτενώς στο overclocking των νέων καρτών. Στην γενιά των RTX αναμένεται ακόμη καλύτερο κυρίως λόγω του ισχυρότερου κυκλώματος τροφοδοσίας των Founders Edition που είναι και αυτό στη λίστα των σημαντικών διαφορών από κατασκευαστικής άποψης που έχουν οι κάρτες της NVIDIA. Πέρα από το επιπλέον headroom σε Watt που ισχυρίζεται η NVIDIA έχουμε πιο σταθερό power delivery στον πυρήνα με λιγότερες αποκλίσεις και αυτόματο overclocking. Την ίδια στιγμή βάζοντας δύο axial fans, όπως γίνεται για χρόνια σε πολλές custom GPUs, οι θερμοκρασίες διατηρούνται σε χαμηλά και υγιή επίπεδα επιβραβεύοντας θεωρητικά τους χρήστες με καλύτερα overclocks.

 

Το SLI μέσω του NVLink interface θα λειτουργεί μόνο μέχρι δύο κάρτες ενώ στην περίπτωση του TU106 πυρήνα και της RTX 2070 δε θα υπάρχει η δυνατότητα αυτή. Έτσι 3-way και 4-way SLI δε θα υπάρξουν στην γενιά των Turing. Το bandwidth αυτής της σύνδεσης θα είναι 25GB/s και αμφίδρομο ενώ σε ένα dual link σενάριο με μια 2080 Ti το bandwidth τετραπλασιάζεται.

 

 geforce rtx nvlinku2x

 

 

 

Οι έξοδοι εικόνας που υποστηρίζονται αλλά θα διαφέρουν πιθανόν από κάρτα σε κάρτα θα είναι DisplayPort 1.4a που θα μπορεί να οδηγήσει και 8K αναλύσεις στα 60Hz και μέχρι δύο 8K αναλύσεις συνολικά. Παράλληλα θα υπάρξει και μια USB Type-C σύνδεση οπότε αναμένομε ένα κύκλωμα 5V να ζει κάπου στο PCB των καρτών για την λειτουργία της. Η σύνδεση θα μπορεί και αυτή να μεταφέρει εικόνα στην οθόνη μας.

 

 

DLSS Antialiasing

Το 2014 είχαμε αναφέρει το τι ακριβώς είναι το antialising, είναι μια τεχνική εξομάλυνσης των ακρών που υπάρχει για δεκαετίες. Δεν είναι η πρώτη φορά που βλέπουμε μια proprietary τεχνική antialising από την NVIDIA μιας και ήδη υπάρχουν αρκετοί developers που αξιοποιούν τεχνικές όπως το TAA (Temporal Antialising) το οποίο λειτουργεί μόνο σε NVIDIA GPUs. Το DLSS υπόσχεται διπλάσιες επιδόσεις σε ανάλυση 4K σε σχέση με το TAA σε παλαιότερης γενιάς hardware όπως την GTX 1080 Ti. Η απόδοση αυξάνεται χάρη στα tensor cores που βρίσκονται στις νέες GPUs τόσο για αυτόν τον σκοπό όσο και για άλλα deep learning tasks. Είναι μια Super Sampling μέθοδος που χρησιμοποιεί AI για να βελτιώσει την ποιότητα εικόνας και λειτουργεί παρόμοια με το SSAA αλλά, με την προθήκη μια εξυπνότερης μεθόδου εκμεταλλευόμενη και τα Tensor Cores των καρτών. Η υποστήριξή του επαφίεται από τους developers και η NVIDIA έχει ήδη ανακοινώσει μερικά games που θα υποστηρίξουν την τεχνική, όμως το μέλλον του δεν είναι δεδομένο. Το DLSS όμως είναι για αρκετούς το σημαντικότερο feature μιας και μπορεί να ωθήσει τις επιδόσεις σε υψηλές αναλύσεις όπως 4K. Στις μετρήσεις της NVIDIA δείχνει πως το DLSS σε μια RTX 2080 Ti μπορεί να γίνει έως και δύο φορές πιο αποδοτικά από μια 1080 Ti με TAA, πάντα σε ανάλυση 4K.

 

 

dlss demo

 

 

 

 

 

GPU Boost 4.0

Στην τέταρτη εκδοχή του το GPU Boost θέτει δύο όρια θερμοκρασίας προτού οι χρονισμοί πέσουν στο base clock του κατασκευαστή, από ένα όριο που υπήρχε στις Pascal. Το πρώτο είναι οι 83 βαθμοί Κελσίου, το όριο που είχαν όλες οι Pascal GPUs, εκεί όπου μια Turing θα ρίξει τους χρονισμούς της όχι στο base clock αλλά στο boost του κατασκευαστή. Ως γνωστόν αρκετές κάρτες, ιδίως οι custom τρέχουν με άνεση λόγω του ισχυρότερου συστήματος ψύξης σε ακόμη υψηλότερους χρονισμούς. Εάν για οποιοδήποτε λόγο η θερμοκρασία παρά το γεγονός ότι η κάρτα τρέχει στο επίσημο boost clock ξεπεράσει το κατώφλι των 85 βαθμών που είναι το 2ο όριο, τότε η GPU θα ρίξει τους χρονισμούς της κι άλλο φτάνοντας στο base clock του κατασκευαστή. Περισσότερα για την αρχιτεκτονική μπορείτε να βρείτε στο επίσημο site της NVIDIA.

 

 

gpuboost4.0 nvidia hwbox

 

 

Περισσότερα για την αρχιτεκτονική μπορείτε να βρείτε στο επίσημο site της NVIDIA. 

 

 

 

 

 

 

 

Testing Methodology
Σελίδα

gaming, gigabyte, performance, gpu, review, graphics, παρουσίαση, δοκιμή, gaming oc, rtx 2060 super, rtx 2070 super, RTX 2080 super , 12nm tsmc

MetallicGR

Members
2019-12-02T13:52:11Z

Μικρό update. Στη τελευταία σελίδα προστέθηκαν γραφήματα με τα average FPS των καρτών στις τρεις αναλύσεις ξεχωριστά και ένα ακόμα που δείχνει το κόστος του κάθε FPS με βάση τα αποτελέσματα της ανάλυσης των x1440 pixel.

Διαβάστε περισσότερα στο Φόρουμ...