miércoles, 30 de junio de 2010

Porque OpenGL > Direct3D? 10 razones.

0 comentarios
 
El Sr. Engine ha recorrido un larguisimo camino, y la verdad es que finalmente se empieza a sentir que falta poco.
Aca hay una escena de prueba en progreso (todavia no esta terminada), lo mejor de todo es que por como esta programado, y gracias a hacks que solo se pueden hacer en OpenGL (no en Direct3D) esto corre de forma safable hasta en una geforce 6100.



No hay nada precomputado (lightmaps/ambientmaps/etc), todo es en tiempo real.
En gran parte, gracias a OpenGL. Porque?
Primero a todo cabe recordar que estoy refiriendome a GL 2.1 vs Directx9 (D3D10 y GL3 son casi identicos), pero si uno quiere hacer algo que corra en todas las computadoras, no se puede usar Directx10 o GL3 de cualquier forma Lengua

1) Batching

Las llamadas a funciones de GL son infinitamente mas baratas que en D3D, primero por no tener que usar objetos sino porque los comandos se batchean en userspace y luego se envian al driver. (en Direct3D casi todo va directo al driver). Esto permite hacer cambios de materiales/shaders/binder arrays/etc con bajo costo.

2) Built-in uniforms

OpenGL 2.1 tiene todo el estado del fixed pipeline accesible, todas las luces, materiales, etc. Esto permite, con un poco de esfuerzo, no usar uniforms y crear shaders extremadamente chiquitos, maximizando la posibilidad de usar conditonal compilation, ya que el estado es persistente aun al cambiar entre shaders (algo asi como bindable uniforms en placas antiquisimas), y el cambio entre shaders es casi gratis (gracias al batching y a que no hay que subir uniforms), se pueden dibujar ej, multiples luces en un pase y cambiar entre combinaciones de luces a una performance enorme.


3) Fast/deferred shader compiles

La compilacion de shaders en OpengL es rapidisima. Sencillamente rapidisma. Principalmente porque el compilador solo pasea el codigo y luego
hace el resto de la compilacion on-demand (cuando el shader se usa). Se puede compilar cientos de shaders en pocos segundos.
En D3D, la compilacion comparativamente es mas lenta ya que hay varios pasos: a) Compilacion a assembler (D3DX) b) Subir el assembler c) El assembler de D3DX decompilado por el driver y recompilado optimizado para la placa (ya que los video card vendors optimizan cada uno para su placa). En la teoria, D3D permite guardar shaders precompilados, lo que agiliza el proceso, pero en la practica, este ultimo paso hace que no sea demasiada la diferencia.

4) Persistent attributes/texcoords

Los texcoords y los attributes son persistentes. Esto quiere decir que siempre estan aunque no se bindeen (el ultimo valor queda puesto). En contraste, Direct3D9 prohibe crear shaders que usan un texcoord/ que no esta bindeado en el streamsource. Sencillamente el shader no funciona.
Esto es horrible, porque no permite a un engine tener una separacion entre geometria y material sin tener que compilar una version del shader que use los mismos arrays que tiene la geometria.

5) Readable/Writable Depth Buffer

Los depth buffers se pueden bindear como textura y leer en OpenGL, y no solo eso sino que se filtran aun en el hardware mas viejo (siempre y cuando sean potencia de 2!). Que permite esto? hacer muchisimas cosas en hardware viejo que nada mas se puede hacer en Directx10, vista+, como por ejemplo


  • Recuperar la posicion de un fragment




  • Shadow maps super baratos (solo escribir a un depth buffer), mas baratos aun usando un depth buffer de 16 bits




  • ESM (Exponential Shadow Maps) baratisimos en hardware antiquisimo, aprovechando que se pueden leer/escribir usando gl_FragDepth para blurear, y filtrar




  • ZClipping de particulas, con borders fadeados




  • SSAO superbarato (lee del depth buffer / escribi al shadow buffer)




  • DOF superbarato





  • 6) read/write buffers y CopyTexSubImage

    Algunas tecnicas requieren hacer copias de buffers. GL provee read/write buffers, para hacer esto sin tener que usar shaders/geometria, lo cual tambien es considerablemente mas rapido.
    GL Permite habilitar/deshabilitar la escritura a diferentes componentes de un framebuffer. Esto esta _buenisimo_, por ejemplo para guardar datos en componentes en diferentes pases. Tecnicas que me resultaron barbaras usado esto fueron glow send en el canal alpha (y bloquearlo cuando se dibujan objetos con transparencia) y especialmente util para tecnicas como dual paraboloid shadow mapping o PSSM, porque puedo guardar los datos (depth) en una sola textura si quiero, ayudar un monton al cache y liberar texunits.

    8) Built-in TC

    En Direct3D existen formatos comprimidos de textura, pero hay que subir los datos a mano comprimidos, o tenerlos ya guardados. Si bien se esta poniendo de moda en DirectX10 hacer la compresion a DXT,BC,etc en un shader en el momento de subir la textura. OpenGL hace la conversion automaticamente (al pedirselo) aun en placas antiguas.

    9) Built-in memory Management

    En Direct3D hay diferetes tipos de memoria (pools) a donde van los arrays, las texturas, etc. Cada uno tiene diferentes restricciones. Si uno elige enviarlo a la memoria de video, entonces la textura o el array no se pueden recuperar.. y si llega a ocurrir un devicelost (que sucede tan solo al resizear una ventana Cheesy), se pierde todo! Algunos engines manejan todo a mano, pero la verdad es que es un bajon tener que preocuparse donde esta cada cosa, asi que Direct3D ofrece una opcion MANAGED, que guarda una copia en memoria de sistema del recurso. Si alguna vez se preguntaron porque los juegos de D3D ocupan tanta memoria, esa es la respuesta . Windows Vista virtualiza la memoria de video para evitar eso cuando el hardware lo provee. OpenGL en cambio sube y baja los recursos de memoria de video cuando es necesario y hasta provee algoritmos de LRU en hardware antiguo, el programador no se tiene que preocupar donde va todo, o a lo sumo proveer hints de uso.

    10) OpenGL es un estandar 

    OpenGL es un estandar, se puede programar/ejecutar en linux, windows, mac, celulares, tabletas, etc.

    Fuente: http://www.adva.com.ar/foro/index.php?topic=7005.0

    Deja tu comentario