„TeraFLOPS“ – Was sich dahinter verbirgt und weshalb wir den Blödsinn ignorieren sollten

Brandybuck · 11. März 2020

Spätestens mit dem Durchsickern des ersten PS5-Devkits starteten Hardware-Spekulanten ihre alltäglichen Gerüchtebombardements mit neuen Vermutungen zur Technik der Next-Gen-Konsolen. Das freut zudem die News-Redaktionen der aktivsten Videospiel-Portale im Netz. „Ein Insider hat verraten, dass die PS5 und der Xbox-One-Nachfolger Ray-Tracing beherrschen!“, „Können PS5 und die neue Xbox wirklich Ray-Tracing?“, „AMD bestätigt Ray-Tracing für die nächste Konsolengeneration.“, „Was könnt ihr von Ray-Tracing auf der PS5 erwarten?“. Ein Buzzword reicht, um es in gefühlt zwanzig Artikeln mit mehr oder weniger demselben Inhalt zu verwursten. Logisch, es handelt sich ja auch nur um Schätzungen, da sind der Fantasie keinerlei Grenzen gesetzt.

Neben der extrem präzisen Darstellungsmethode für Schatten, Spiegelungen und Beleuchtung sowie der modernsten Festplattentechnik, springt dem aufmerksamen Leser eine kryptische Angabe immer wieder ins Auge. „TeraFLOPS“ sind seit PS4 Pro und Xbox One X in aller Munde. Während das Standardmodell der vierten PlayStation-Generation auf verschwindend geringe 1,84 TeraFLOPS beziffert wird, schafft es die aktuellste Xbox-Revision auf ganze 6. Heftig, oder? Schließen wir wirklich daraus, dass eine Xbox One X dreimal so schnell ist wie die Sony-Konkurrenz? Wie skaliert das überhaupt? Äußert sich das in der Framerate oder sind Spiele jetzt dreimal so hübsch? Kann man Schönheit denn überhaupt messen? Wir stoßen unweigerlich an unsere Grenzen, logische Anwendungsszenarien zu entwerfen.

Aber es klingt erstmal nach etwas Technischem und vor allem nach verdammt viel. Man kann sich die Marketing-Meetings bei Agenturen blumig ausmalen: „Leute, hier sind die Datenblätter zu der Konsole, irgendwas müssen wir doch in der Kampagne nutzen können.“ – „Chef, Chef, Chef, hier, ich habe es gefunden! TeraFLOPS, das klingt nach nerdiger Zukunftstechnik und ist noch nicht so durchgenudelt. Hat auch einen schönen Klang. Tera. Fast so wie das lateinische Wort für Erde. Viel schwungvoller als Megahertz, frischer als Gigabyte und zart wie Bockwürste. Oh, woopsie, das ist für die Würstchenwerbung, die wir morgen besprechen.“

Performance-Marketing mal anders

Und so hat die Tech-Industrie ein neues Marketing-Gimmick entworfen, das auch sogleich Anklang fand. TeraFLOPS hier, TeraFLOPS da. Passt perfekt in eine News-Headline und der Otto-Normal-User muss sich nicht einmal durch den Artikel klicken, er zieht sich einfach die Daten aus der Überschrift und speichert sie als gültigen Leistungsvergleich ab.

Unabhängige Tests demonstrieren ein klares Leistungsbild für PC-Hardware | Quelle: GamersNexus

Die Konsolenhersteller haben damit endlich den heiligen Gral gefunden, nach dem sie seit gut dreißig Jahren angestrengt suchten. Es war stets unmöglich der Zielgruppe einen quantifizierbaren Performance-Zuwachs verständlich zu vermitteln. PC-Bastler wurden dahingehend jahrzehntelang verwöhnt: Benchmarks in verschiedenen Applikationen zeichneten ein genaues Bild, was von einem neuen Bauteil erwartet werden konnte.

Hardware-Lieferanten waren kontinuierlich bemüht, die Presse mit Testmustern auszustatten, denn nichts erschütterte den Wettbewerb so sehr wie ein zehnprozentiger Vorsprung in Framerate-Analysen von Crysis. Wenn der Preis dann auch noch stimmte – sicherer Kauf. Bei den kleinen Videospielkisten hingegen? Naja, da musste man sich eben auf Demos und Trailer, die weitgehend auf Prototypen basierten, stützen, damit der potenzielle Käufer sieht, wie gut das Gerät performt. Die Spitze des Eisbergs? Das legendäre Debakel, das sich Sony eingeheimst hat, als man versuchte, CGI-Trailer als Echtzeitmaterial zu verkaufen, nur um UNBEDINGT besser dazustehen als Microsoft mit seiner (zu diesem Zeitpunkt) früher erscheinenden, günstigeren und weitaus komfortabler programmierbaren Xbox 360.

2005 glaubten wir Sony tatsächlich, dass es sich um Echtzeitgrafik von PS3 handelte:

Vom Verkaufsflop zum TeraFLOP – der steinige Weg von Xbox One

Nun reicht eine Angabe in einem PR-Tweet, um hunderttausende Interactions zu triggern und für jede Menge Gesprächsstoff im Internet zu sorgen:

Xbox Series X
– 12 TeraFLOPS

And BOOOOOOOOOOOOOOOOOOOOOM goes the dynamite! Keine teuren Tech-Demos, man muss sich nicht um realistische Performance-Messungen scheren und die Zahl ist im Vergleich zur Xbox One X doppelt so hoch. Versteht jeder und passt zum Zeitgeist. Wir brechen munter jeden Bereich unseres alltäglichen Entertainments zur besseren Einordnung auf Zahlen runter, wieso dann nicht auch Videospielkonsolen? „Hey, wie findest du Sekiro?“ – „Puh, 8/10.“. „Was für einen Fernseher willst du dir holen?“ – „Auf jeden Fall 4K.“ Einordnen ist simpel, um Details schert sich kaum jemand und man investiert seine immens wichtige Lebenszeit ausschließlich in das Beste. Wie jeder weiß, ist eine 7,5/10 schon der größte Schrott. Genau deshalb funktionieren weiterhin Top-Listen so gut.

Das mache ich mir an dieser Stelle einfach mal zunutze, um euch gedanklich auf technischen Firlefanz vorzubereiten. Hier also meine Top-3-Liste mit Gründen, weshalb ihr TeraFLOPS als Werkzeug, das euch Konsolen schmackhaft machen soll, ignorieren solltet.

Auf Platz 3 – Die mangelhafte Abbildung technischer Faktoren, die sich wirklich auf die Leistung auswirken

AMD-Chips auf einem Silizium-Wafer – Jeder davon einzigartig in seiner Beschaffenheit | Quelle: AMD

Habt ihr euch einmal gefragt, wie TeraFLOPS eigentlich gemessen werden? Sollte man definitiv tun, wenn Leistungsfähigkeit auf dem Prüfstand steht, zumal die Antwort so simpel wie unerwartet ist: Gar nicht! Grundsätzlich soll die Angabe der Menge an Gleitkommaberechnungen, die ein Chip imstande ist durchzuführen, pro Sekunde entsprechen. Das hätte euch auch Google Translate verraten können, wenn ihr Floating Point Operations Per Second (FLOPS) eingegeben hättet. Damit habe ich dann auch schon mit der „Recherchearbeit“ der meisten Online-Publikationen zu dem Thema gleichgezogen. Kommen wir lieber zu interessanteren Fakten. Es handelt sich um eine rein synthetische Größe, um die Leistung eines Prozessors abzubilden, schließlich sind Gleitkommaberechnungen so nah am Metall wie beispielsweise Binärcode.

Auffällig ist ja schon, dass die TFLOPS-Angabe keine fluktuierende Größe ist, was bei tech-affinen PC-Bauern bereits im Ansatz für Stirnrunzeln sorgen dürfte, denn die Erfahrung weist eigentlich darauf hin, dass jeder individuelle Chip, sogar in derselben Produktreihe, qualitativ komplett einzigartig ist. Vor allem für Übertakter sind diese Fertigungsunterschiede interessant, da man „besser gelungene“ Prozessoren deutlich unproblematischer über der Herstellerspezifikation betreiben kann. Die Menge an maximal möglichen Gleitkommaoperationen pro Sekunde ist hingegen immer starr angegeben, was daran liegt, dass sie nicht gemessen, sondern berechnet wird. Das geschieht nach der Formel „SHADER UNITS x BASISTAKT x 2 INSTRUKTIONEN PRO TAKT“, die auch perfekt aufschlüsselt, welche Hardware-Daten überhaupt abgeleitet werden können.

Nehmen wir als Grundlage die 12 TeraFLOPS von Xbox Series X. Ein einfaches Rechenbeispiel wären 3000 Shader Units und 2000 MHz Basis-Takt der GPU und wir erhalten die von AMD angegebene Anzahl an Gleitkommaberechnungen. In der Praxis wäre ein so hoch getakteter Grafikprozessor völliger Blödsinn, selbst der TU106-Chip einer Nvidia RTX 2070 wird mit „nur“ 1400 MHz Basistakt betrieben. Wir bewegen uns hier in der 500€-Preisklasse von PC-Grafikkarten, die gemeinhin höher als eine APU in einer Konsole takten. Nehmen wir doch an, dass dieser Basistakt für eine Konsole erreichbar ist, was zudem realistisch wäre, da die Grafikeinheit von Xbox One X mit immerhin 1170 MHz angetreten ist. Als Ergebnis können wir eine Shader-Anzahl von circa 4280 ableiten, denn:

4286 Shader Units x 1400 MHz Basistakt x 2 Instruktionen pro Takt = 12.000.800 FLOPS oder auch 12 TeraFLOPS

Tatsächlich kann man daraus auf ein potenzielles Leistungsbild schließen, denn der Renderablauf moderner Computergrafik basiert zu Großteilen auf Shading, was mittlerweile vielerlei Funktionen zur Manipulation polygonbasierter Objekte und Texturen beinhaltet. Wie viele dieser Shading-Operationen von der Grafikeinheit durchgeführt werden können, ist eng an die angegebenen Shader Units und den Basistakt geknüpft, weshalb sich eine Steigerung der Computing-Power positiv auf Spiele auswirkt.

Auch sind meine vermuteten Zahlen nicht aus der Luft gegriffen, sondern wurden in einem vergleichbaren Maß schon bei PC-Hardware eingesetzt. In der Formel fehlen allerdings bedeutsame Variablen, die letztendlich bestimmen, wie viele Bilder die GPU bei einem gegebenen Workload berechnen kann. Zu nennen wären da etwa Texture Mapping Units (TMUs), die Texturen anpassen und über ihre 3D-Modelle legen, Render Output Units (ROPs), die final den entstandenen Frame zusammensetzen und in den Buffer schreiben sowie Anti-Aliasing hardwareseitig steuern, oder auch die sehr entscheidende Speicherbandbreite, die Auskunft über den Datendurchsatz gibt. All diese Komponenten sind Indikatoren für die theoretische Leistungsfähigkeit des Grafikprozessors, in der Formel zur Ermittlung der möglichen Gleitkommaberechnungen spielen sie dagegen keine Rolle.

Auf Platz 2 – Die Gesamtarchitektur diktiert die Performance, nicht die einzelnen Komponenten

Für diese Annahme kann ich ein praxisnahes Beispiel angeben, das deutlich zur Schau stellt, dass eine GPU nicht zwangsläufig viele Bilder pro Sekunde herauspumpen kann, obwohl Shader Units und FLOPS in immens hohen Mengen vorrätig sind. Bereits vor fast drei Jahren bot die AMD Radeon RX Vega 64 völlig irrsinnige 13,7 TeraFLOPS in seiner wassergekühlten Variante. Erreicht wurde das mit 1677 MHz im maximalen Boost sowie 4096 Shader Units. Für Crypto-Miner stellte sich die Karte als Segen heraus. Die hohe Computing-Leistung ermöglicht, dass pausenlos Gleitkommaberechnungen abgearbeitet werden können, der Workload bleibt dabei immer gleichförmig. Bei fast 500GB/s Speicherbandbreite konnte zudem gut nachgeschaufelt werden.

Schematischer Aufbau einer GPU mit RDNA-Architektur | Quelle: AMD

In Spielen setzte sich dieser Trend nicht fort. Eine herkömmliche Nvidia Geforce GTX 1080 war in nahezu allen getesteten Spielen unabhängig von der Auflösung performanter, obwohl ihr 1500 Shader Units fehlten, um gleichzuziehen, die Datentransferrate zum Speicher deutlich niedriger war und sie fast 50% weniger Verlustwärme produzierte. Die Ursache lässt sich bei der Konzeption beider Chips finden. Während AMDs Flaggschiff sehr ineffizient mit seinen massig zur Verfügung stehenden Ressourcen umging, hat die Nvidia-Konkurrenz mit ihrem GPU-Design ein perfektes Zusammenspiel aller Einzelkomponenten ermöglicht. Das fängt schon beim Aufbau der Computing Units (CUs) an. In diesen Einheiten werden eine Vielzahl von Hardware-Shadern zusammengefasst, ein Rechenwerk gibt dann die Instruktionen an die einzelnen Units weiter. Da Shader mittlerweile sehr vielfältig programmiert werden können, muss das Rechenwerk die Aufgaben sehr geschickt verteilen, um effizient zu arbeiten.

Man darf dahingehend nicht verschweigen, dass AMD in den letzten Jahren große Fortschritte erzielt hat. Mit der RDNA-Architektur hat man ein neues Konzept vorgestellt, das zur Konkurrenz aufschließen konnte, wenn auch mit kleinen Abstrichen. Zumindest sofern man hardwarebeschleunigtes Ray-Tracing außen vor lässt. Das soll dann mit RDNA2 verfügbar sein.

Es ist also davon auszugehen, dass Xbox Series X und PS5 das theoretische Leistungspotenzial der verbauten AMD-APU klar besser auf die Straße bekommen als es die Vega 64 mit völlig veralteter Graphics-Core-Next-Architektur vermochte. Ein Sprung um 100% wäre jedoch an den Haaren herbeigezogen, da neue Chip-Designs nie wirklich erprobt sind und der Umgang damit erst erlernt werden muss. Aufgrund dessen kann sich die resultierende Spieleleistung in beide Richtungen verändern. Zudem lässt die TFLOPS-Formel andere Komponenten, wie bereits erwähnt, außen vor – Wichtige Puzzleteile, deren Zusammenspiel von einer leistungsfähigen Chiparchitektur gewährleistet sein muss, werden nicht einbezogen.

Und ungeschlagen auf Platz 1 – Videospiele sind keine synthetischen Workloads, sondern verdammt willkürlich

Jeder Leser, der sich ein wenig mit IT auskennt, wird diesen Punkt schon vor etlichen Zeilen erkannt haben. „Der faselt die ganze Zeit von Shader Units und ganz viel Hardware! Die Studios hängen doch sowieso letzten Endes in spezialisierten Entwicklungsumgebungen rum und beschäftigen sich gar nicht en détail mit dem Gerät!“. Klebt euch ein Fleißbienchen ins Hausaufgabenheft, denn damit habt ihr absolut recht.

Die Kreation solcher Szenen verlangt nicht nur der Hardware, sondern auch den Entwicklern alles ab | Quelle: Control / 505 Games, Remedy Entertainment

Die Magie, die auf euren Bildschirmen entfacht wird, entsteht nahezu ausschließlich auf der Software-Ebene. Spiele-Engines gehen völlig unterschiedlich mit bestimmten Hardware-Ressourcen um und fundamentale Komponenten, wie die genutzte API und Treiber, können eine nicht zu verachtende Rolle spielen. Ganz einfach ausgedrückt: Es wäre für einen geübten Informatiker kein Problem, einen Grafikprozessor mit ein paar Code-Zeilen maximal auszulasten, der Workload ist schnell geschrieben und beinhaltet keinerlei Präzisierungen für einzelne Aufgaben. Videospiele versuchen das natürlich zu vermeiden, obwohl jeder einzelne Code-Baustein völlig unterschiedlicher Natur sein kann.

Damit hadern hochkomplexe Grafikfeuerwerke seit Jahren. Auf der einen Seite versuchen Engine-Entwickler einzelne Implementierungen zu simplifizieren, um den Programmieraufwand noch menschenmöglich zu halten, andererseits entstehen dadurch so viele Systeme, die ineinandergreifen müssen, dass ein einziger Fehler im Code ein ganzes Spiel lahmlegen kann. Allein der Medientypus „Videospiel“ bedingt diese Art der Konstruktion, da ein Animationssystem z. B. nicht von Kollisionsabfragen oder der Soundgenerierung abgekoppelt sein kann.

Es wird den Entwicklern schlecht optimierter Games ja gern mal Faulheit oder mangelndes Wissen vorgeworfen, das ist in der Praxis hingegen mitnichten der Fall. Diejenigen, die es in die Industrie und zu großen Studios geschafft haben, sind meist die Speerspitze in ihrem Fach. Und das nicht nur im Coding – Wenn es um Systeme für Lichtbrechungen, Physik, Reflexionen oder Verhalten von Materialien geht, sind Kenntnisse zu hochwissenschaftlichen Feldern wie Mathematik und eben Physik unabdinglich. Man muss ja nur einmal rüber zu Rennsimulationen schielen. Reibungswiderstände an den Reifen, G-Kräfte oder die Beschaffenheit von Untergründen sind physikalische Prinzipien, die ein Unbeleckter nicht einfach mal herleiten kann.

Mit DirectX 12 und Vulkan kamen dann noch APIs hinzu, die Low-Level-Zugriffe auf die Hardware ermöglichten und damit den Treiber, der Instruktionen der Software für die GPU verständlich kommuniziert, möglichst wenig beanspruchten. Das Resultat ist dann ja ein Performance-Gewinn, da Entwickler viel näher an der eigentlichen Hardware arbeiten können, nicht wahr? Jaaaaaaaaa, neeeeeee. Nicht ganz. Mit mehr Low-Level-Zugriff steigt die Komplexität der Programmierung erstmal sprunghaft an, obwohl man in der Theorie mehr Leistung herauskitzeln könnte. Das ist auch der Grund, weshalb die ersten DirectX-12-Versionen von PC-Spielen furchtbare Ergebnisse lieferten. Die Technik war neu und der Umgang damit nicht verbreitet, dementsprechend lief die gehabte DX11-Variante im Schnitt durchgängig performanter.

Im Blueprint-Editor der Unreal Engine 4 wird die Funktionsweise einer Deckenlampe manipuliert – eines der einfachsten Beispiele | Quelle: Epic Games

Die Unwägbarkeiten nehmen kein Ende

So viel zum technischen Unterbau. Was in den Engines und vielen weiteren Drittanbieter-Tools kreiert wird, ist dann noch einmal eine ganz andere Geschichte. Entwickler schreiben häufig die Software, auf der das Spiel basiert, in ganz grundsätzlichen Funktionen um, damit es bestens in ihren Workflow passt und man zielgerichtet die Ansprüche an das fertige Produkt erfüllen kann. Ihr merkt schon, Code über Code über Code, unzählige Potenziale zur Optimierung.

Mit solch einem Text kann ich nicht im Ansatz genug Respekt für das zuständige Leitpersonal zollen, das über all diese Bruchstücke die Übersicht bewahrt. Dabei helfen zwar mittlerweile sehr clevere Programme für die Aufzeichnung vorgenommener Änderungen, aber wie viel bei Software-Entwicklung unglücklich schiefgehen kann, tut sich einem meist erst auf, wenn man sich tiefgehend mit der Spieleentwicklung beschäftigt. Wusstet ihr, dass die CryEngine so wenig genutzt wird, weil Crytek sehr nachlässig mit der Dokumentation für Lizenzabnehmer ist? Ein an sich gutes Werkzeug, das Features reichhaltig bereitstellt und aufgrund einer Kommerzialisierungsabsicht entstanden ist, wird dadurch für etliche Teams nahezu unbrauchbar.

Entwickeln in der CRYENGINE, wenn der investierte Aufwand zu groß wird

Das ist ein modernes Beispiel, meine erste Begegnung mit der Tatsache, dass scheinbar kleinste Ungereimtheiten einen nicht zu verachtenden Einfluss im Entstehungsprozess nehmen können, war die Bonus-DVD meiner The Elder Scrolls IV: Oblivion Limited Edition. Da standen vier Entwickler gemeinsam vor einer Workstation, da sich bei der Implementierung eines neuen Animations-Features in das bestehende Physiksystem sämtliche Subroutinen zur Schattenberechnung in der Engine verabschiedeten. Die Lösung? „Erhöhe mal die Lumineszenz von Kerzenschein um 1.“ Und siehe da, alles lief wieder wie gehabt. Dafür funktionierte die KI von Assassinen nicht mehr und sobald es Nacht wurde, crashte das gesamte Spiel.

Wie das überhaupt alles zusammenhängen kann? Das dürft ihr mich nicht fragen. Tatsache ist, dass Programmierer sich vorrangig damit auseinandersetzen, wie die Konsolen auf ihren Code und die Kreationen innerhalb der Dev-Tools reagieren, nicht damit, was auf Hardware-Ebene exakt vor sich geht. Das ist ein völlig anderes, hochspezialisiertes Fach, das von den Studios gar nicht beackert werden kann, da entsprechendes Personal extrem rar gesät und kostspielig ist. Die Schlussfolgerung daraus? Euer auserkorener Titel und die Rohleistung der Konsolen befinden sich selten im Einklang, Echtweltszenarien und synthetische Leistungsträger divergieren in hohem Maße.

Natürlich schaffen es besonders talentierte, hocherfahrene und perfekt zusammengestellte Studios das kleine Quäntchen mehr Performance aus der Konsole zu kitzeln und für sich zu nutzen. Eine TeraFLOPS-Angabe kann dafür allerdings kein Indikator sein, denn die Variablen, die reell über euer Spielvergnügen entscheiden, sind so vielzählig wie dieser Artikel bereits lang, weswegen ich nun die Finger stillhalte und euch mal direkt frage: Würdet ihr gern über bestimmte Tech-Gebiete mehr erfahren? Seid ihr grundsätzlich gegenüber technischeren Aspekten von Videospielen offen? Verratet es uns doch im Forum.

Titelbild: Xbox Series X, Microsoft

**Blackiris** · 11. März 2020

Sehr cooler und informativer Artikel!

Spiritogre · 11. März 2020

Man muss natürlich deutlich unterscheiden, andere Engines, andere Grafikschnittstellen, gar andere Treiber bringen unterschiedliche Leistung.

Grundsätzlich kann man TFlop jedoch schon zum Vergleich heranziehen. Das fiel mir bei meinem letzten PC und beim Erscheinen der PS4 Pro auf. Leistungstechnisch lag meine GPU von AMD direkt in der Mitte zwischen PS4 und PS4 Pro und das zeichnete auch die Spieleperformance in den meisten (Multiplattform) Titeln exakt wieder.

Dann aber gab es z.B. Titel wie Doom (2016), das auf PC auch die Vulkan Schnittstelle unterstützt und wie frühere ID Spiele, die gerne Open GL nutzten, auch da ordentlich an Leistung zulegten. So war dann Doom etwa bei meinem alten PC mit Vulkan plötzlich schneller als auf der PS4 Pro. Muss dazu dann allerdings sagen, das er eben ein Ausnahmetitel blieb, der die AMD Hardware und die Schnittstelle eben extrem gut ausnutzen konnte.

Izanagi · 11. März 2020

Optimierung ist absolut alles! Wäre es nicht so dann müssten die PCs solch extreme Unterschiede zu den Konsolen aufweisen dass es auf keine Kuhhaut passt. Tatsächlich sind die Unterschiede aber bei aufwendigen und gut optimierten Konsolenspielen nahzu nicht vorhanden. Die TFlops dienen dazu den Kunden die Leistung "sichtbar" zumachen in Form einer Zahl. Ähnlich wie bei Kameras wo die Hersteller mit Megapixel um sich werfen obwohl da auch andere Faktoren wichtiger sind.
Ich möchte fast wetten dass wenn die PS5 schwächer als die 12Tflops der XSX wäre, man real so gut wie keinen Unterschied sehen würde. Es gibt genug Spiele auf dem PC die selbst auf einem Highend Gerät nicht flüssig laufen und gerade AAA Exklusivtitel auf den Konsolen zeigen deutlich dass auch mit wenig Tflops tolle Grafik erreicht werden kann. Erst wenn PC Ports optimiert werden kommt der Unterschied in Form der Framerate oder anderen Sachen ans Licht.
Hohe Leistung fördert manchmal sogar die Faulheit der Entwickler weil man teile des Optimierungsprozesses sausen lassen kann da die übersättigende Leistung als Puffer dient. Da auf dem PC aber der Konsumwahn herrscht und alle paar Monate neue Komponenten rauskommen, ist die Optimierung nahzu unmöglich. Zumal dann jedes System anderst ist was Konsolen einen großen Vorteil verschafft.

Vielen wissen auch nicht dass alleine durch eine Auflösung von 4K exorbitant mehr Leistung benötigt wird und zwar unverhältnissmäßig mehr.

**Koji** · 11. März 2020

Super Artikel! Wenngleich ich jetzt auch nicht sage das Tflops an sich Blödsinn sind. Es ist schon ein Richtwert, aber wie er genutzt wird ist völliger Blödsinn. Eben da jeder Ottonormal-Verbraucher eine Gesamtbewertung erwartet. Es spielen einfach so viele Faktoren noch eine Rolle, die ja ausfürlich hier beschrieben sind. Aber es hat sich nun nunmal als DER Referenzwert etabliiert, leider. Wenn es wengistens eine ganzheitliche, messbare und nachvollziehbare Gesamtbewertung des System wäre, würde das noch Sinn ergeben. Abgesehen das es immernoch recht wenig über die Lauffähigkeit der Spiele sagen wird, ebenfalls recht umfangreich im Artikel erklärt, es ist eben das Zusammenspiel der Hardware und Software auf die es ankommt.

Tflops sind somit ein grober Richtwert der GPU-Leistung, nicht mehr und nicht weniger.

Ist ja das selbe wie mit 8k. Hauptsache man kann es dran schreiben und es liest sich gut. Das wird auch nur wieder ausgetrickst mit Skalierung, was möglich ist. Nichtmal aktuelle PC Hardware kann das in letzter Instanz perfekt darstellen. Dann kann es eine Konsole erst recht nicht. Eine vernünftige 4k-Impelemntierung sollte in dieser Generation eher im Mittelpunkt stehen.

DrChrisRespect · 11. März 2020

Zitat von Spiritogre

Grundsätzlich kann man TFlop jedoch schon zum Vergleich heranziehen. Das fiel mir bei meinem letzten PC und beim Erscheinen der PS4 Pro auf. Leistungstechnisch lag meine GPU von AMD direkt in der Mitte zwischen PS4 und PS4 Pro und das zeichnete auch die Spieleperformance in den meisten (Multiplattform) Titeln exakt wieder.

Ist aber dennoch schwierig zu bemessen. Grundsätzlich könnte man sagen, dass die GPU gut in Relation setzbar ist, da sie ebenfalls von AMD stammt und die Chips aufgrund der GCN-Architektur grundsätzlich bauähnlich sind, jedoch lässt sich Performance am PC recht schwer zusammenfassen. Waren die Auflösungen deckunsgleich? War die Konsole in 4K performanter oder der PC? Stimmte der Detailgrad mit den Konsolen überein? Anti-Aliasing? Anisotrope Filter? Wie schauen die Frametimes auf der Konsole aus? 99-Percentile?

Die PS4-Versionen nutzen nämlich häufig verschiedene Techniken, die Shader performanter berechnen, dafür aber unter Anderem für Banding oder andere Artefakte sorgen können. So 100%ig lassen sich die Geräte deshalb nicht einordnen, aber eben erstmal subjektiv grob.

Zitat von Izanagi

Hohe Leistung fördert manchmal sogar die Faulheit der Entwickler weil man teile des Optimierungsprozesses sausen lassen kann da die übersättigende Leistung als Puffer dient.

Den Punkt wollte ich extra herausarbeiten, da er faktisch nicht stimmt. Niemand in der Industrie ist faul. Videospiele entstehen in einem unfassbar langem Prozess mit teilweise harten Crunchzeiten, da wirtschaftliche Faktoren für die Investoren von viel höherem Belang sind als der Perfektionismus des Personals. Zumal verschiedene Architekturen, SDK-Umgebungen und Bug-Fixing auf 4 Plattformen nicht einfach mal so über Nacht im Detail erlernt sind.

Wenn überhaupt, dann stellt sich die Frage auf Managementebene, ob sich Optimierungsarbeit finanziell rentiert oder nicht. Ist halt schon Unterschied, ob du ein 100-köpfiges Team monatelang darauf ansetzt oder 2 Programmierer, die sich zwei Wochen lang mit Überstunden darum kümmern dürfen.

Lando · 12. März 2020

Guter Artikel. Interessant, zu erfahren, dass dieses Gerede von TF eher Werbung und PR ist, statt ausschlaggebend für die Leistungsfähigkeit einer Konsole zu stehen. Ich muss ehrlich sagen, dass ich mich von Microsoft - die diesen Terminus gerne benutzen, um zu protzen -, hab verführen lassen und fast schon bereit war, deren neue Konsole der PS5 (die angeblich weniger TF bieten soll) vorzuziehen.

Spiritogre · 12. März 2020

Zitat von DrChrisRespect

Ist aber dennoch schwierig zu bemessen. Grundsätzlich könnte man sagen, dass die GPU gut in Relation setzbar ist, da sie ebenfalls von AMD stammt und die Chips aufgrund der GCN-Architektur grundsätzlich bauähnlich sind, jedoch lässt sich Performance am PC recht schwer zusammenfassen. Waren die Auflösungen deckunsgleich? War die Konsole in 4K performanter oder der PC? Stimmte der Detailgrad mit den Konsolen überein? Anti-Aliasing? Anisotrope Filter? Wie schauen die Frametimes auf der Konsole aus? 99-Percentile?
Die PS4-Versionen nutzen nämlich häufig verschiedene Techniken, die Shader performanter berechnen, dafür aber unter Anderem für Banding oder andere Artefakte sorgen können. So 100%ig lassen sich die Geräte deshalb nicht einordnen, aber eben erstmal subjektiv grob.

Das ist richtig, auf dem PC gibt es massig mehr Kantenglättungsverfahren und sonstige Spielereien, welche die Konsolen nicht bieten. D.h. um fair zu vergleichen müsste man solche Einstellungen auf dem PC so im Bereich der mittleren Werte setzen.

Beim genannten Doom war es eben so, dass es auf meinem alten PC (Radeon R9 380) mit allen Settings auf Maximalanschlag mit über 60FPS in Full HD lief. Also grafisch besser als auf den Konsolen.

Generell spiele ich nur Full HD, wenn es ein Spiel anbietet (Borderlands, Assassin's Creed...) lasse ich es intern aber auch gerne mal höher berechnen und dann auf dem FHD Schirm runterskaliert ausgeben.

Zum Thema Optimierung auf Konsolen. Bei Spielen wie Uncharted 4 wurde etwa so optimiert, dass das Spiel Szenenweise durchgeschaut wurde und die Vegetation, sprich Bäume, Büsche etc. dann händisch entfernt wurden, bis die Leistung passte. Das ist natürlich nur für maximal zwei Hardwarekonfigurationen überhaupt sinnvoll zu machen. Von daher kann man in so einem Fall natürlich sagen, Uncharted 4 würde auf einem PC mehr Leistung benötigen oder auf einem gleichschnellen PC schlechter laufen - im Austausch hätte man dafür aber eben ein Mehr an Vegetation, sprich letztlich bessere / lebendigere Grafik.
Von daher bin ich bei dieser Art der "Optimierung" immer ein wenig zwiespältig, ob man das überhaupt so nennen sollte, da es ja mit einem Qualitätsverlust einhergeht. Im Idealfall sollte eine Optimierung aber sein, ein Spiel bei gleicher Grafik besser laufen zu lassen.

lucmat · 12. März 2020

Sehr guter Artikel, der eigentlich alles sagt. Jedoch stimmt es nicht ganz bzw. generell zu sagen die "TeraFLOPS" Angabe wäre sinnlos. Es bildet die THEORETISCHE Rechenleistung der GPU wieder. Natürlich ist das, wie es im Artikel steht, kein indikator dafür wie der Grafikchip performt und eben in Games abschneidet. Da spielen noch andere Faktoren eine Rolle. Prinzipiell ist das vergleichbar mit der PS Angabe bei Autos. Theoretisch ist ein 300PS Motor performanter als eine 200PS Maschine. Da kommt es aber dann auf das Gewicht vom Fahrzeug, der breite der Reifen und die Getriebeübersetzung an, wie viel Power das Auto dann auf die Straße bringt. Eine 200PS Lotus Elise ist definitiv schneller als ein 300PS Ford Mustang. So könnte man auch ein Artikel schreiben, dass die PS und Drehmoment Angabe ignoriert werden kann.

Izanagi · 12. März 2020

Ja genau und Chrunchtime bedeutet nichts anderes als Optimierung und Entwickler die Geld sparen wollen, sparen an der Optimierung. Wie willst du es sonst begründen dass ständig Patches nachgeschoben werden können und das Spiel dann plötzlich 2 Jahre nach Launch um 100% besser läuft und besser aussieht. So wird der Prozess eben auf nach dem Launch gelegt. Faul ist vielleicht der falsche Ausdruck aber viele nehmen so den Kostendruck weg. Auf einem stärkeren System kann man ein Spiel definitiv einfacher halbwegs erträglich lauffähig machen als auf einer schwachen Gurke.
Optimierung bedeutet ja nicht nur besser Grafik oder mehr Details sondern eine perfekte Mischung zu finden mit möglichst guter Grafik und guten Frames.

Das Problem ist an den Tflops zudem dass meist das Gesamtsystem einer Konsole diese Leistung bietet, wärend beim PC nur die GPU so stark ist. Bei der Xbox Series X soll es aber wohl so sein dass der Grafikchip diese Leitung bringt. Trotzdem würde eine etwas schwächere PS5 auch nicht großartig schlechtere Ergebnisse bieten. Ein Großteil spielt eh nur in Full HD.

DrChrisRespect · 12. März 2020

Zitat von lucmat

Sehr guter Artikel, der eigentlich alles sagt. Jedoch stimmt es nicht ganz bzw. generell zu sagen die "TeraFLOPS" Angabe wäre sinnlos. Es bildet die THEORETISCHE Rechenleistung der GPU wieder.

Steht aber auch exakt so im Artikel, sogar (im MS-Word-Dokument) seitenlang. Natürlich ist die Überschrift reißerischer gewählt als der Inhalt darunter, den sollte man beim Kommentieren allerdings nicht ausklammern.

Zitat von Spiritogre

Zum Thema Optimierung auf Konsolen. Bei Spielen wie Uncharted 4 wurde etwa so optimiert, dass das Spiel Szenenweise durchgeschaut wurde und die Vegetation, sprich Bäume, Büsche etc. dann händisch entfernt wurden, bis die Leistung passte. Das ist natürlich nur für maximal zwei Hardwarekonfigurationen überhaupt sinnvoll zu machen. Von daher kann man in so einem Fall natürlich sagen, Uncharted 4 würde auf einem PC mehr Leistung benötigen oder auf einem gleichschnellen PC schlechter laufen - im Austausch hätte man dafür aber eben ein Mehr an Vegetation, sprich letztlich bessere / lebendigere Grafik.
Von daher bin ich bei dieser Art der "Optimierung" immer ein wenig zwiespältig, ob man das überhaupt so nennen sollte, da es ja mit einem Qualitätsverlust einhergeht. Im Idealfall sollte eine Optimierung aber sein, ein Spiel bei gleicher Grafik besser laufen zu lassen.

Je nachdem, Uncharted 4 spart bspw. auch bei den Wassereffekten in bestimmten Szenen (was zu massivem Banding führen kann) und das Post-Process-Anti-Aliasing ist nicht allzu rechenintensiv. Gerade letzteres ist ein "Feature", das wirklich gern von PS4-Exclusives verwendet wird und worauf ich mitunter stark negativ reagiere, weil es im Vergleich zu MSAA oder TXAA auf dem PC furchtbar verwaschen aussieht. Und man könnte eben auf PC-Hardware optimieren. Weiß leider nicht, wie gut es bei Detroid gelungen war, müsste ich mir mal anschauen. Ich würde das aber grob als "Trickserei" bezeichnen. Das Kleinhalten der Draw Distance ist ja ein probates Mittel, egal auf welchem System. Wenn die dann auch noch "handverlesen" ist? Why not, so hat der Entwickler es zumindest blickwinkelabhängig optimiert.

Also, ja, ich glaube auch, dass ohne viel Aufwand Uncharted 4 deutlich schlechter auf einem PC laufe würde (bei gleicher Leistung), aber die Optimierungen recht gut gewählt sind, da sie nicht stark ins Auge fallen.

Zitat von Lando

Guter Artikel. Interessant, zu erfahren, dass dieses Gerede von TF eher Werbung und PR ist, statt ausschlaggebend für die Leistungsfähigkeit einer Konsole zu stehen. Ich muss ehrlich sagen, dass ich mich von Microsoft - die diesen Terminus gerne benutzen, um zu protzen -, hab verführen lassen und fast schon bereit war, deren neue Konsole der PS5 (die angeblich weniger TF bieten soll) vorzuziehen.

Man darf halt auch nicht vergessen, dass das eine Maximalangabe ist. Ist ja nicht so, als würde die Leistung IMMER erreicht werden. Wenn die Kühlung z. B. schlecht ist, taktet sich die APU runter, was wiederum die Leistung beeinträchtigt. Der Takt könnte genauso gut aber auch ein theoretischer Maximalwert sein, der mal auf einem Chip-Sample im absoluten Boost für ein paar Sekunden gehalten wurde, bis die Abwärme zu groß wurde. Thermal Throttling ist da ein weiterer Faktor, den ich mal außen vor gelassen habe, weil das (denke ich) interessanter ist, wenn man die Konsolen auch vor sich stehen hat. Und ich den Artikel noch auf einer verträglichen Länge halten wollte.

DrChrisRespect · 12. März 2020

Zitat von Izanagi

Ja genau und Chrunchtime bedeutet nichts anderes als Optimierung und Entwickler die Geld sparen wollen, sparen an der Optimierung. Wie willst du es sonst begründen dass ständig Patches nachgeschoben werden können und das Spiel dann plötzlich 2 Jahre nach Launch um 100% besser läuft und besser aussieht. So wird der Prozess eben auf nach dem Launch gelegt. Faul ist vielleicht der falsche Ausdruck aber viele nehmen so den Kostendruck weg. Auf einem stärkeren System kann man ein Spiel definitiv einfacher halbwegs erträglich lauffähig machen als auf einer schwachen Gurke.
Optimierung bedeutet ja nicht nur besser Grafik oder mehr Details sondern eine perfekte Mischung zu finden mit möglichst guter Grafik und guten Frames.

Das Problem ist an den Tflops zudem dass meist das Gesamtsystem einer Konsole diese Leistung bietet, wärend beim PC nur die GPU so stark ist. Bei der Xbox Series X soll es aber wohl so sein dass der Grafikchip diese Leitung bringt. Trotzdem würde eine etwas schwächere PS5 auch nicht großartig schlechtere Ergebnisse bieten. Ein Großteil spielt eh nur in Full HD.

Etwas anderes als ein Teil der GPU-Leistung kann auch nicht in TeraFLOPS berechnet werden, da die Angabe nur bei Vektoroperationen (durch Gleitkommaberechnungen) nützlich ist. Ausgenommen natürlich CPUs, die sind bei Spielen jedoch mit völlig anderen Berechnungen je nach Befehlssatz beschäftigt. Durch das Fehlen darauf spezialisierter Einheiten würden Vektoroperationen darauf unfassbar lahmarschig ausfallen.

Und ne, "Crunchtime" ist etwas völlig anderes und dient eigentlich nur als Überbegriff für eine konzentriert hohe Arbeitslast auf dem Personal. Der Hauptanteil davon wird allerdings von Bugfixing belegt, Engine- und Code-Optimierungen werden meist nur von einem kleineren Teil des Teams vorgenommen, die darauf auch spezialisiert sind. Also vornehmlich Tech-Artists und Programmierer, wobei letztgenannte auch schwer mit Bugfixing beschäftigt sind. Auf die Hardware ausgelegt Engine-Optimierung findet auch ständig statt, ansonsten würde man jahrelang ins Blaue arbeiten.

Doppeltes Nein: Nicht die Entwickler wollen Geld sparen, sondern die Geldgeber (Publisher, Investoren, Aktionäre). Gibt wenige unabhängige Studios, die völlig frei von Publisher-Restriktionen arbeiten können. Kojima Productions oder FromSoft bspw.

lucmat · 13. März 2020

Zitat von DrChrisRespect

Steht aber auch exakt so im Artikel, sogar (im MS-Word-Dokument) seitenlang. Natürlich ist die Überschrift reißerischer gewählt als der Inhalt darunter, den sollte man beim Kommentieren allerdings nicht ausklammern.

Hab ich ja nicht, zu Beginn steht, dass der Artikel alles sagt ich jedoch dem kompletten Kontext widerspreche, dass die Angabe "blödsinn" ist. Deswegen der Vergleich mit den Autos. Ein weiteres Beispiel wäre die Verbrauchsangabe, die unter bestimmten Vorraussetzungen bei Fahrzeugen ermittelt wird und sich nicht mit den Realbedingungen deckt. Oder die TDP Angabe, die nicht den Verbrauch einer CPU widerspiegelt. Deswegen sage ich, dass die FLOPS Angabe nicht ganz sinnlos ist, weil ja Hersteller irgendetwas angegeben müssen um in etwa die Leistung der GPU aufzuzeigen. Mir fällt spontan keine andere Alternative ein, mit welchem Wert man sonst die Leistung von GPUs vergleichen könnte. Was wirklich raus kommt, kann man erst in Vergleichtests ermitteln.

Und um noch mal schnell was zur Konsolenoptimierung zu sagen:
Wie viele schon sagen, kommt es zum einen auf das Talent der Entwickler an was für eine Grafik und Leistung sie aus der vorhanden Technik zaubern. Verglichen mit einem PC wissen die Entwickler jedoch welche Hardware in den Konsolen steckt, welche Features die Komponenten bieten und dementsprechend darauf optimieren. Konsolen sind in erster Linie fürs Gaming konzipiert, da läuft keine Antiviren Software im Hintergrund oder andere Programme die man noch installiert hat. Deswegen können gute Entwickler aus vergleichsweise schwacher Hardware viel mehr herausholen, wofür man am PC wesentlich stärkere Hardware braucht. Ein gutes Beispiel ist The last of Us auf der PS3. Die Konsole hatte 256Mb (!) Ram und das Spiel sieht auf der Konsole fantastisch aus. Ein PC mit 256Mb Ram kann heutzutage nicht mal mehr das Betriebssystem stemmen. Und der Grund warum Spiele die später erscheinen als die Ersten einer Konsolengeneration liegt nicht nur daran, dass die Entwickler besser mit der Hardware zurecht kommen. Da ich mal bei Nintendo gearbeitet habe, weiß ich, dass die Firmware Updates der Konsolen neben den ganzen sichtlichen Verbesserungen auch Treiberupdates beinhalten, wie es auch bei den PCs der Fall ist. Auch das SDK wird ständig aktualisiert und beinhaltet Verbesserungen um immer etwas mehr aus der Konsole heraus zu kitzeln. Wenn ein Spiel auf der Konsole nicht gut läuft, bekommt man bei Supportanfragen meist zuerst geraten die Firmware zu aktualisieren. Bei Nintendo war es so, dass das benötigte Update mit auf den Datenträgern drauf war, sonst startete das Spiel erst garnicht.

Spiritogre · 13. März 2020

Zitat von lucmat

Verglichen mit einem PC wissen die Entwickler jedoch welche Hardware in den Konsolen steckt, welche Features die Komponenten bieten und dementsprechend darauf optimieren. Konsolen sind in erster Linie fürs Gaming konzipiert, da läuft keine Antiviren Software im Hintergrund oder andere Programme die man noch installiert hat. Deswegen können gute Entwickler aus vergleichsweise schwacher Hardware viel mehr herausholen, wofür man am PC wesentlich stärkere Hardware braucht.

Ein gutes Beispiel ist The last of Us auf der PS3. Die Konsole hatte 256Mb (!) Ram und das Spiel sieht auf der Konsole fantastisch aus. Ein PC mit 256Mb Ram kann heutzutage nicht mal mehr das Betriebssystem stemmen. Und der Grund warum Spiele die später erscheinen als die Ersten einer Konsolengeneration liegt nicht nur daran, dass die Entwickler besser mit der Hardware zurecht kommen. Da ich mal bei Nintendo gearbeitet habe, weiß ich, dass die Firmware Updates der Konsolen neben den ganzen sichtlichen Verbesserungen auch Treiberupdates beinhalten, wie es auch bei den PCs der Fall ist. Auch das SDK wird ständig aktualisiert und beinhaltet Verbesserungen um immer etwas mehr aus der Konsole heraus zu kitzeln. Wenn ein Spiel auf der Konsole nicht gut läuft, bekommt man bei Supportanfragen meist zuerst geraten die Firmware zu aktualisieren. Bei Nintendo war es so, dass das benötigte Update mit auf den Datenträgern drauf war, sonst startete das Spiel erst garnicht.

Richtig ist, auf PC laufen mehr Programme im Hintergrund, allerdings werden die unter neueren Windows-Versionen bei Programmen im Vordergrund die viel Leistung wollen dann auch quasi intern abgeschaltet oder soweit zurückgefahren, dass sie kaum noch ins Gewicht fallen.
Wobei die 256MB der PS3 damals allerdings auch damals schon extrem wenig waren (Standard waren damals mind. 4GB, oft eher 8GB im PC) und neben der komplizierten CPU für viele Leistungsprobleme verantwortlich sind, gerade eben bei Multiplattformtiteln sieht die 360 Fassung nicht zufällig in der Regel besser aus.

Im Endeffekt ist die verbaute Hardware heute aber egal, es sind alles X86 PCs die voll kompatibel sind. Der Rest wird eben von Treibern und API bestimmt. D.h. man kann heutzutage gar nicht mehr auf eine bestimmte Hardware optimieren. Die Zeiten wo irgendwer in Assembler einen Chip direkt anspricht sind seit Ewigkeiten vorbei. Die Spielesoftware selbst spricht immer nur die Treiber und Schnittstellen an, also andere Software.

Was übrigens eben, wie du es ansprichst, einer der Gründe für die ständigen Updates der Konsolen ist. Da Treiber und Schnittstellen ständig erweitert und optimiert werden.

DrChrisRespect · 13. März 2020

Zitat von lucmat

Hab ich ja nicht, zu Beginn steht, dass der Artikel alles sagt ich jedoch dem kompletten Kontext widerspreche, dass die Angabe "blödsinn" ist. Deswegen der Vergleich mit den Autos. Ein weiteres Beispiel wäre die Verbrauchsangabe, die unter bestimmten Vorraussetzungen bei Fahrzeugen ermittelt wird und sich nicht mit den Realbedingungen deckt. Oder die TDP Angabe, die nicht den Verbrauch einer CPU widerspiegelt. Deswegen sage ich, dass die FLOPS Angabe nicht ganz sinnlos ist, weil ja Hersteller irgendetwas angegeben müssen um in etwa die Leistung der GPU aufzuzeigen. Mir fällt spontan keine andere Alternative ein, mit welchem Wert man sonst die Leistung von GPUs vergleichen könnte. Was wirklich raus kommt, kann man erst in Vergleichtests ermitteln.

Mir würde spontan sofort eine Angabe einfallen, die PERFEKT die Leistung der Konsole widerspiegelt: Frames per Second. Ließe sich in vielen verschiedenen Games als Querschnitt messen, passt aber nicht auf eine E3-Konferenz. Sieht man ja, wie scheißlangweilig Presseveranstaltungen von AMD und Nvidia sind. Und Konsolengamer sind historisch dafür nicht sonderlich empfänglich.

Dennoch würde ich dabei bleiben, dass die TFLOPS-Angabe sinnlos ist, da du von ihr (wie auch geschrieben) keinen Wert ableiten kannst und sie auch recht willkürlich berechnet wird. Gelten die 12 TFLOPS der Series X im Boost (wahrscheinlich) oder Basis (unwahrscheinlich)? Die der One X ist bspw. im Basistakt berechnet. Die von Nvidia-Grafikkarten meistens auch im Basis, AMD bezieht sich bei seinen GPUs meistens auf den Boost. Macht jeder anders, ist letztendlich keine wissenschaftliche Formel. Und selbst wenn, hast du keinerlei plastische Vorstellung, wie 12 TFLOPS aussehen. Da würde ich mich lieber von nicen Tech-Demos berieseln lassen, die genauso nichtssagend sind, aber sich verdammt schick anschauen.

Zitat von Spiritogre

Im Endeffekt ist die verbaute Hardware heute aber egal, es sind alles X86 PCs die voll kompatibel sind. Der Rest wird eben von Treibern und API bestimmt. D.h. man kann heutzutage gar nicht mehr auf eine bestimmte Hardware optimieren. Die Zeiten wo irgendwer in Assembler einen Chip direkt anspricht sind seit Ewigkeiten vorbei. Die Spielesoftware selbst spricht immer nur die Treiber und Schnittstellen an, also andere Software.
Was übrigens eben, wie du es ansprichst, einer der Gründe für die ständigen Updates der Konsolen ist. Da Treiber und Schnittstellen ständig erweitert und optimiert werden.

Natürlich wird vorrangig auf Software optimiert. Dennoch lässt sich schon sagen, dass du auf bestimmte Hardware hin optimieren kannst. Mit Low-Level-APIs wie DX12, Vulkan und Gnm kannst du bestimmte Operationen auf der Hardware steuern. Etwa Priorisierungsketten oder wie sich Anti-Aliasing verhalten soll. Natürlich macht das kein Mensch mehr im Assembly Code, bei der heutigen Komplexität von Spielen, würdest du wahrscheinlich jahrzehntelang an einem einzelnen Indie-Spiel sitzen.

So zumindest heutzutage. Bei der Xbox 360 nutzten viele Entwickler auch den eRAM direkt neben dem Grafikchip ganz unterschiedlich. Wobei das auch weitestgehend über die Software gemacht wurde. Könnte man natürlich sagen, dass alles, was ich genannt habe, nur auf Software-Ebene stattfindet. Wie auch sonst? Am Metall kann man nichts ändern. Das Verhalten der Hardware auf die Software lässt sich aber schon analysieren und dann in dem Rahmen, der einem gegeben ist, optimieren. Ältere AMD-Hardware war z. B. in der Pixel-Shader-Berechnechnung immer etwas lahmarschig im Vergleich zur Konkurrenz. Dementsprechend kannst du schauen, wie du deine Pixel Shader möglichst schlank hältst, aber dann bei Fragment oder Tesselation mehr aufdrehen.

Spiritogre · 13. März 2020

Zitat von DrChrisRespect

Natürlich wird vorrangig auf Software optimiert. Dennoch lässt sich schon sagen, dass du auf bestimmte Hardware hin optimieren kannst. Mit Low-Level-APIs wie DX12, Vulkan und Gnm kannst du bestimmte Operationen auf der Hardware steuern. Etwa Priorisierungsketten oder wie sich Anti-Aliasing verhalten soll. Natürlich macht das kein Mensch mehr im Assembly Code, bei der heutigen Komplexität von Spielen, würdest du wahrscheinlich jahrzehntelang an einem einzelnen Indie-Spiel sitzen.

So zumindest heutzutage. Bei der Xbox 360 nutzten viele Entwickler auch den eRAM direkt neben dem Grafikchip ganz unterschiedlich. Wobei das auch weitestgehend über die Software gemacht wurde. Könnte man natürlich sagen, dass alles, was ich genannt habe, nur auf Software-Ebene stattfindet. Wie auch sonst? Am Metall kann man nichts ändern. Das Verhalten der Hardware auf die Software lässt sich aber schon analysieren und dann in dem Rahmen, der einem gegeben ist, optimieren. Ältere AMD-Hardware war z. B. in der Pixel-Shader-Berechnechnung immer etwas lahmarschig im Vergleich zur Konkurrenz. Dementsprechend kannst du schauen, wie du deine Pixel Shader möglichst schlank hältst, aber dann bei Fragment oder Tesselation mehr aufdrehen.

Darauf will ich hinaus. Bei einem Treiber-Update hilft dir dann im Notfall sämtliche Optimierung nichts, weil plötzlich alles wieder anders ist. Man merkt es dann teils daran, dass ältere Spiele mit einmal schlechter laufen oder neuere Spiele einen kleinen Leistungszuwachs bekommen (oder auch mal andersrum), ohne dass da irgendwas am Spiel selbst geändert wurde.

PS: FPS sind kein Leistungsindikator sondern einzig ein Vergleichswert. Deswegen gab es früher ja so Benchmarkprogramme, die dann aus verschiedenen festgelegten Demoszenen einen Wert berechneten, am populärsten war früher viele Jahre lang der 3DMark.
Theoretisch könnten die Hersteller also so einen Benchmark im Stil von Cinebench und Co. als Standard festlegen und dann mit deren Werten werben bzw. sie auf die Packung drucken.

DrChrisRespect · 13. März 2020

Diese synthetischen Benchmarks wie 3DMark (oder heutzutage Futuremark, Superposition, Atomic Heart, usw.) und co. bringen dir nur nichts, weil es keine Echtweltszenarien abbildet, sondern eben dort auch synthetische Workloads sind. Dafür sind Spiele einfach zu willkürlich. Man merkt es ja teilweise schon daran, wie unpraktikabel manche Ingame-Benchmarks sind. Der Benchmark von Wolfenstein: Youngblood ist z. B. völlig unbrauchbar im Vergleich zum eigentlichen Spiel und gibt völlig unrealistische Werte aus, obwohl er In-Engine gerendert wird. Dasselbe bei Final Fantasy 15.

Einige funktionieren hingegen recht gut, z. B. die von Gears of War 4 oder Rise of the Tomb Raider. Als einzig wahrer Leistungsindikator ist es natürlich Quatsch, ohne Kontext bringt es dir nichts, wenn du "Kann Gears 5 in 200fps darstellen!" auf die Packung druckst. Kann in anderen Spielen dann mehr oder weniger sein. Oder im selben Spiel bei unterschiedlichen Einstellungen/Settings. Es ist jedoch die ehrlichste Abbildungsmöglichkeit für den Zweck, für den du Leistung suchst, wenn der Messungskontext angegeben ist.

Deswegen meinte ich ja, dass ich eigentlich für visuelle Überzeugungskraft am ehesten empfänglich bin, weswegen bei mir auch so eine Quake-2-Ray-Tracing-Veröffentlichung oder eine Demo von Control mehr reinknallt als eine "UNFASSBARE 12 TFLOPS!"-Meldung aus der Marketing-Abteilung. Wenn Microsoft mit einem lauffähigen Prototypen der genannten Applikationen mit hohen Framerates um die Ecke kommen würde, meine Fresse wäre ich beeindruckt. TFLOPS hingegen? Gähn.

lucmat · 14. März 2020

Zitat von DrChrisRespect

Diese synthetischen Benchmarks wie 3DMark (oder heutzutage Futuremark, Superposition, Atomic Heart, usw.) und co. bringen dir nur nichts, weil es keine Echtweltszenarien abbildet, sondern eben dort auch synthetische Workloads sind. Dafür sind Spiele einfach zu willkürlich. Man merkt es ja teilweise schon daran, wie unpraktikabel manche Ingame-Benchmarks sind. Der Benchmark von Wolfenstein: Youngblood ist z. B. völlig unbrauchbar im Vergleich zum eigentlichen Spiel und gibt völlig unrealistische Werte aus, obwohl er In-Engine gerendert wird. Dasselbe bei Final Fantasy 15.

Einige funktionieren hingegen recht gut, z. B. die von Gears of War 4 oder Rise of the Tomb Raider. Als einzig wahrer Leistungsindikator ist es natürlich Quatsch, ohne Kontext bringt es dir nichts, wenn du "Kann Gears 5 in 200fps darstellen!" auf die Packung druckst. Kann in anderen Spielen dann mehr oder weniger sein. Oder im selben Spiel bei unterschiedlichen Einstellungen/Settings. Es ist jedoch die ehrlichste Abbildungsmöglichkeit für den Zweck, für den du Leistung suchst, wenn der Messungskontext angegeben ist.

Deswegen meinte ich ja, dass ich eigentlich für visuelle Überzeugungskraft am ehesten empfänglich bin, weswegen bei mir auch so eine Quake-2-Ray-Tracing-Veröffentlichung oder eine Demo von Control mehr reinknallt als eine "UNFASSBARE 12 TFLOPS!"-Meldung aus der Marketing-Abteilung. Wenn Microsoft mit einem lauffähigen Prototypen der genannten Applikationen mit hohen Framerates um die Ecke kommen würde, meine Fresse wäre ich beeindruckt. TFLOPS hingegen? Gähn.

Generell erstmal Respekt für dein technisches Hintergrundwissen. Ich mag ja generell solche Themen und diskutiere gerne darüber. Im vorletzten Post schreibst du, dass man die FPS als Vergleichswert für die Rohleistung statt den Flops nehmen sollte. In diesem zitierten Post widersprichst du dir aber quasi selbst. Je nach Spiel oder Benchmark schneidet GPU X total unterschiedlich ab.

Zitat von Spiritogre

R
Im Endeffekt ist die verbaute Hardware heute aber egal, es sind alles X86 PCs die voll kompatibel sind. Der Rest wird eben von Treibern und API bestimmt. D.h. man kann heutzutage gar nicht mehr auf eine bestimmte Hardware optimieren. Die Zeiten wo irgendwer in Assembler einen Chip direkt anspricht sind seit Ewigkeiten vorbei. Die Spielesoftware selbst spricht immer nur die Treiber und Schnittstellen an, also andere Software

Das ist völliger Blödsinn. Mal davon abgesehen, dass wir von Konsolen reden die ein festes Ökosystem haben, kann man selbst im PC Bereich auf bestimmte Hardware hin optimieren, indem man bestimmte Features der Hardware nutzt, nur nicht in solch einem großen Stil wie bei Konsolen. Bei AMD gibt es z. B. Das gaming evolved Programm, bei dem Hersteller auf Radeon GPUs hin optimieren. Ich glaube das nVidia Gegenstück nennt sich gameworks oder so, hab jetzt keine Lust nach dem Namen zu googeln. Das Beste Beispiel ist da Wolfenstein 2. Das Spiel kann wie Doom mit Shader Intrinsic (GCN und Vega) umgehen und so gewisse Hardwarekomponenten von Radeon-Grafikkarten direkt ansprechen. Zudem nutzt das Spiel erstmals FP16-Shader mit Rapid Packed Math (nur Vega), sodass auf entsprechenden Grafikkarten die Shader ressourcenschonender und schneller als die klassischen FP32-Shader berechnet werden können. Das hatte den Effekt, dass die eigentlich durchweg langsamere Vega GPU die damals eigentlich deutlich schnellere und weitaus teurere 1080 Ti schlagen konnte. Da aber nicht jeder PC die selbe GPU beheimatet fällt die Optimierung nicht so aggressiv aus wie auf Konsolen. Wenn die Hardware keine Rolle spielen würde, wie du schreibst, müssteman ja auch die Spiele nicht portieren, damit es auf anderen Konsolen oder dem PC läuft, sondern könnte alles mit selbem Code laufen lassen.

DrChrisRespect · 14. März 2020

Zitat von lucmat

Generell erstmal Respekt für dein technisches Hintergrundwissen. Ich mag ja generell solche Themen und diskutiere gerne darüber. Im vorletzten Post schreibst du, dass man die FPS als Vergleichswert für die Rohleistung statt den Flops nehmen sollte. In diesem zitierten Post widersprichst du dir aber quasi selbst. Je nach Spiel oder Benchmark schneidet GPU X total unterschiedlich ab.

Nene, ich habe geschrieben, dass FPS als reelle Leistungsangabe am besten dienlich ist, weil die Rohleistung in TFLOPS (aus den im Artikel genannten Gründen) nichts bringt. Dass du damit nur an der Wahrheit kratzt, ist logisch, deswegen ist dabei der Kontext (Spiel + Auflösung + Detailgrad) so wichtig. Eine allgemeingültige Aussage über die Leistung ist aber völlig unmöglich, da braucht man sich nichts vormachen.

Vor allem, wenn du eben solche Exoten wie die id Tech 6 mit Half-Precision antreten lässt.

Izanagi · 14. März 2020

FPS bringen genauso wenig denn wenn du die Details runterschraubst hast du im Normalfall eine höhere Framerate. Mit irgendetwas muss man ja werben und Terraflops hört sich unglaublich wichtig und super an. Wenn sich jemand an Daten aufhängen will ist es eigentlich egal ob er Tflops, FPS oder sonst was nimmt. Die Wahrheit ist aber dass man sicherlich kaum einen Unterschied zwischen 9Tflops und 12 Tflops sehen würde.

Benchmarks sind in der Tat sowas von nicht aussagekräftig weil sie quasi nur kleine Echtzeitfilme sind. Auch hier kann ein Hersteller seine Hardware darauf optimieren um super Ergebnisse zu erzielen. In Spielen sieht dass dann ganz anderst aus. Es gibt einfach keinen Pauschalwert für gute Ergebnisse weil es rein vom Entwickler abhängt wie gut er sein Spiel anpasst und zurecht schleift.

Die X86 Architektur ermöglich lediglich eine einfachere kompatibilität unter den System aber dass bedeutet nicht dass man ohne Aufwand alles portieren kann. Die Spiele können einfacher zum laufen gebracht werden aber sie laufen nicht automatisch gut. Sieht man ja allzu oft an den Konsolenports auf dem PC. CD Project Red hat damals bei Witcher 2 geschrieben dass das Spiel sofort auf der Xbox 360 geloffen ist weil diese dem PC ähnlich war, wärend es auf der PS3 nicht gelaufen ist. Trotzdem war noch ein Haufen an Anpassung nötig weil die Ressourcen stark begrenzt waren im Vergleich zum PC. Die PS3 Architektur hat aber einen Port gänzlich unmöglich gemacht.
Eine Konsole hat durchaus einen großen Vorteil weil eben alle verbauten Komponenten identisch sind und das bei zig Millionen Geräten.