Vai al contenuto
bear75

test - V-Ray RT OpenCL (GPU)

Recommended Posts

VRAY RT GPU TEST

Propongo un thread sul test delle gpu con vray RT 2.0.

La scena, preparata da Vlado, si scarica qui:

http://www.spot3d.co...ch_interior.rar

E' già pronta all'uso, basta lanciare il render.

E' impostata per fermarsi automaticamente raggiunta una certa soglia di qualità (512paths/pixel).

Per partecipare al test è richiesto di eseguire il render con Vray RT GPU 2.0, salvare e postare l'immagine, ad esempio tramite un servizio di hosting (pctuneup...) e fornire i seguenti parametri:

- schede video: tipo, VRAM, numero e frequenze, se overcloccate

- driver installati

- processori: core e frequenze

- memoria RAM

- temperature

- sistema operativo

- tempo di rendering

ecco un esempio:

- 3m 25s

- 2 gtx 460 2gb 800mhz core 1600mhz shaders 2ghz ram

- Temperatura GPU: 65°/70°

- driver NVIDIA 260.99

Core i7 920 2,66GHz @ 3,8GHz.

- 12GB ddr3 1600

- 7 pro X64

http://www.pctunerup...161352_test.jpg


Modificato da papafoxtrot

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

- 1m 41s

Net render

PC1

- 2 gtx 460 2gb 800/2000

- driver NVIDIA 258.96

- Core i7 920 2,66GHz @ 3,8GHz

- 12gb ddr3 1600

- 7 pro x64

PC2

2 gtx 460 2gb 800/2000

- driver NVIDIA 258.96

- q6600 @ 3,2ghz

- 8gb ddr2 1000

- Vista x64

th_20101221093710_4gtx460.jpg


Modificato da papafoxtrot

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

allora.. questo e il test ufficiale su sito chaos

discussione http://www.chaosgroup.com/forums/vbulletin/showthread.php?52400-test-scene

mi pare, che vlado nn e il autore di scena.. appena lo vedo in skype lo chiedo .)

comunque.. vi faccio vedere un po di risultati questi giorni.

anche su forum di chaos ci sono alcuni risultati.. potete vedere su questo topic http://www.chaosgroup.com/forums/vbulletin/showthread.php?52415-GPU-benchmarks

robabilmente va aggiornato.. comunque potete postare i vs. risultati sia qua, sia su chaos forum.

saluti

d.

PS

2x GTX 460 sono uguali a una GTX570.. sia come prezzo, che come performance.

PPS

peccato, che 470 non si trova piu.. e MIGLIOR sk. video per CUDA/OpenCL render secondo la formula prezzo/performance. comuqnue occhio ai driver.

PPS

metto il topic "importante".

se ho un po di tempo libero.. si mettano anche un po di prove in DR estremo :)


Modificato da BeaZtiE

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

allora.. questo e il test ufficiale su sito chaos

discussione http://www.chaosgrou...2400-test-scene

mi pare, che vlado nn e il autore di scena.. appena lo vedo in skype lo chiedo .)

comunque.. vi faccio vedere un po di risultati questi giorni.

anche su forum di chaos ci sono alcuni risultati.. potete vedere su questo topic http://www.chaosgrou...-GPU-benchmarks

robabilmente va aggiornato.. comunque potete postare i vs. risultati sia qua, sia su chaos forum.

saluti

d.

PS

2x GTX 460 sono uguali a una GTX570.. sia come prezzo, che come performance.

PPS

peccato, che 470 non si trova piu.. e MIGLIOR sk. video per CUDA/OpenCL render secondo la formula prezzo/performance. comuqnue occhio ai driver.

PPS

metto il topic "importante".

se ho un po di tempo libero.. si mettano anche un po di prove in DR estremo :)

E soprattutto la gtx460 è l'unica con 2gb di memoria :)

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

allora.. questo e il test ufficiale su sito chaos

discussione http://www.chaosgroup.com/forums/vbulletin/showthread.php?52400-test-scene

mi pare, che vlado nn e il autore di scena.. appena lo vedo in skype lo chiedo .)

comunque.. vi faccio vedere un po di risultati questi giorni.

anche su forum di chaos ci sono alcuni risultati.. potete vedere su questo topic http://www.chaosgroup.com/forums/vbulletin/showthread.php?52415-GPU-benchmarks

robabilmente va aggiornato.. comunque potete postare i vs. risultati sia qua, sia su chaos forum.

saluti

d.

PS

2x GTX 460 sono uguali a una GTX570.. sia come prezzo, che come performance.

PPS

peccato, che 470 non si trova piu.. e MIGLIOR sk. video per CUDA/OpenCL render secondo la formula prezzo/performance. comuqnue occhio ai driver.

PPS

metto il topic "importante".

se ho un po di tempo libero.. si mettano anche un po di prove in DR estremo :)

scusa BeaZtiE,

ma dai test mi sembra che 2 460 gtx vanno come una 580, non 570...

hai dei test sulla 570?


Modificato da bear

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Chiedo scusa x il mio ritardo.

un po di risultati da parte mia.

Quadro 600 - 28 m 51 s

Quadro 2000 - 14 m 28 s

Quadro 4000 - 8 m 20 s

2x Quadro 4000 - 4 m 11 s

GTX 470 258.96 - 3 m 55 s

GTX 470 259,81 - 3 m 58 s

GTX 570 - 3 m 35 s

2x GTX 570 - 1 m 48 s

3x GTX 570* - 1 m 17 s

*attenzione.. il terzo slot e pic-e 4x (in slot 16x) e mi pare, che questo e il motivo di avere questo performance.. secondo la logica deve stare su circa un minuto.

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

... cioe' se ho ben capito due GTX570 dimezzano ampiamente i tempi di render rispetto ad una coppia di Quadro 4000? Ed una singola GTX570 stacca di quasi 25minuti una Quadro 600? Impressionante!

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

3x GTX 570* - 1 m 17 s

*attenzione.. il terzo slot e pic-e 4x (in slot 16x) e mi pare, che questo e il motivo di avere questo performance.. secondo la logica deve stare su circa un minuto.

Questo è molto interessante. Qui si stava ragionando sul fatto che il bus PCI express, in una motherboard per Sandy Bridg con il chipset per la CPU ad una sola linea x16, una volta caricata la scena non avrebbe più influito sul calcolo, anche con riferimento a dei post su Octane Render dello sviluppatore. Adesso, Vray RT Gpu, è OpenCL e sfrutta anche la CPU, mi chiedo se sia questo il motivo del crollo delle prestazioni della terza scheda, o è una cosa che capita sempre nel calcolo GPU. Tu che hai le possibilità di provare molte configurazioni potresti fare altre verifiche? Magari se puoi anche con Octane.

Comunque si sapeva che le GTX e le Quadro con lo stesso processore avevano le medesime prestazioni, sono i Cuda core che contano, quindi una GTX 580 è allineata ad una Quadro 6000 che costa dieci volte tanto! Le Quadro meglio usarle solo per la viewport se necessario. :)


Modificato da enri2

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Questo è molto interessante. Qui si stava ragionando sul fatto che il bus PCI express, in una motherboard per Sandy Bridg con il chipset per la CPU ad una sola linea x16, una volta caricata la scena non avrebbe più influito sul calcolo, anche con riferimento a dei post su Octane Render dello sviluppatore. Adesso, Vray RT Gpu, è OpenCL e sfrutta anche la CPU, mi chiedo se sia questo il motivo del crollo delle prestazioni della terza scheda, o è una cosa che capita sempre nel calcolo GPU.

Eh no, è proprio li il fatto! Dato che lo slot è lento, il tempo di caricamento è maggiore, e questo impatta sul tempo di render. Non c'è nulla di elaborato. Il tempo di elaborazione è dato dal tempo di caricamento + il tempo di render... La terza scheda permette di ridurre proporzionalmente il tempo di render, ma il tempo di trasferimento è più alto, perché il bus è lento. Per cui alla fine il tempo totale di elaborazione cala in modo meno che proporzionale al numero di schede.

Ovviamente quoto il fatto che non sorprende la velocità delle geforce rispetto alle quadro.


Modificato da papafoxtrot

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Ma il render non parte solo quando la scena è già stata caricata, e non prima?

Come possono le due cose essere contemporanee?


Modificato da enri2

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Si, ma nel tempo di elaborazione tu devi considerare anche il trasferimento! Ora, magari beaztie ha riportato i tempi di solo render, ma a mio avviso sarebbe imposrtante conoscere il tempo totale... E immaginavo che fosse quello ad essere stato riportato!

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Questo è molto interessante. Qui si stava ragionando sul fatto che il bus PCI express, in una motherboard per Sandy Bridg con il chipset per la CPU ad una sola linea x16, una volta caricata la scena non avrebbe più influito sul calcolo, anche con riferimento a dei post su Octane Render dello sviluppatore.

Chi parla per sandy bridge? e questo NON e vero, che dici.. magari su 1155 e cosi, pero e limitazione fatta a posto.. ma no su veri sandy (questi classe pro) la situazione e diversa.. vengono su mercato tra circa un anno ;-) quindi nn posso neanche provare. con 1155 non penso di fare nessuna test. cpu tottalmente castrata..

Ancora non esiste il "vero" SB (lga2011) ma solo la classe consumer 1155 - e un altra classe fuori di target professionale.

Adesso, Vray RT Gpu, è OpenCL e sfrutta anche la CPU, mi chiedo se sia questo il motivo del crollo delle prestazioni della terza scheda, o è una cosa che capita sempre nel calcolo GPU.

il performance in v-ray RT OCL e gestito SOLO di schede video. la CPU in questo caso NON centra nulla (a parte il link pci-e che fanno la communicazione tra istruzzioni messi da CPU e le GPU. tutto qua)

Una FERMI moderna ha bisogno di performance che corrisponde a minimo di ~40 Gbps una PCI-E v.2 a 4 Lane fa circa 16 Gbps. Questo signifia, che oltre la metta di "tubo" che trasmette/riceve i dati manca.

Tu che hai le possibilità di provare molte configurazioni potresti fare altre verifiche? Magari se puoi anche con Octane.

a parte, che ho licenza per uso aziendale di octane.. non ho nessuna intenzione di provare nulla su questo render engine, che in pratica per me e totalmente fuori target.

comunque secondo i test, che ho fatto qualche mese fa ho visto, che il supporto scalabile non e cosi ben definito, come v-ray ed arion. (comunque arion viaggia molto bene.. purtoppo non posso dire questo per octane)

Comunque si sapeva che le GTX e le Quadro con lo stesso processore avevano le medesime prestazioni, sono i Cuda core che contano, quindi una GTX 580 è allineata ad una Quadro 6000 che costa dieci volte tanto! Le Quadro meglio usarle solo per la viewport se necessario. :)

Allora le quadro vanno benissimo per lavoro in viewport - in alcuni test prima avevo visto, che una quadro 6000 si comporta UGUALMENTE come una GTX470. la 480 dava 3-5% piu alto performance. ora come ora io personalmente non vedo bisogno

e ora ti spiego come e la situazione con quadro e geforce.

in pratica escono 6-7 diversi "qualita" di stesso chip senza importanza se il chip e CPU o GPU (con intel/amd e stessa cosa)

le qualita maggiori, con consumi piu bassi (quindi il voltaggio piu basso) vanno messi su quadro.. da 6000 entro 4000

dipende dal chip

il esempio e per GF100 - comunque sara la stessa cosa per GF110 etc..

puoi questi.. che nn vanno montate su quadro vanno montate su tesla.

dopo che la qualita piu bassa di GF100 va devisa a 3 qualita.. migliore e peggiore..

la migliore va montata su GTX480, puoi su 470 e alla fine su 465 (una scheda scomparsa una settimana dopo la sua nascita)

il motivo e molto semplice.. se vuoi avere ottima qualita di un chip.. devi avere anche la soluzione "backup". Tieni presente che da 100 chip 1-2 sono a 100% funzionanti.. altri 5-6 sono con qualita piu bassa ma molto buona.. il resto di circa 80-90 pezzi e per resto. quindi per il mercato game.. cosi tutti sono contenti.. i gamer hanno schede video low cost.. i professionisti hanno abbastana buoni prezzi in range quadro 600 entro quadro 4k (ovviamente 5k e 6k sono essagerate come prezzi - ma chi ha bisogno compra) e la "macchina" di commercio, produzione e soddisfare il mercato funziona.

la solita roba per tutte le cpu.. la solita cosa anche per i chip di memoria..

Alla fine.. vuoi ottima qualita? garantita a 100% paghi un sacco di soldi..

vuoi la soluzione economica?? ecco la scheda gamer.. e buona notte. tutti buoni e zitti.

comunque in departo pro di nVidia si investano milioni di dollari per il sviluppo open gl, cuda, open cl, supporto max, maya, sistemi cad etc.. e queti investimenti li deve pagare qualcuno.. chi paga? questi, chi lavorano nel settore professionale.

per me la politica di prezzi (entro quadro 4000) va benissimo.. peccato, che 5000 e 6000 sono cosi costose, che non si tocano neanche.

Allora per altra domanda..

spiego semplice come funziona il prog. path trace (ma anche quassi tutti metodi di render)

in pratica e un maccello di communicazioni tra processore e le sk. video. (o magari la cpu / fpu)

per ogni "passo" girano GB di communicazioni tra la cpu/fpu, gpu e memoria via il chipset che gestisce questa communicazione.

in ogni secondo passano circa 20-30 GB di dati (anche di piu in alcuni casi.. come questo con le tre GTX 570) perche ogni circa 40 gbps consuma circa 5-6 GB per secondo. (a parte il bandwith interno - GPU <-> RAM, che va oltre 150 Gbps) dentro nella cpu e communicazione + gestione di tutto lavoro altri

un altra cosa..

gia fatto un po di test su GTX560ti.. mi dispiace per tutti, che la aspettano ;-) risultato 4 m 33 s ;-) (cloccata!!! vi faccio sapere il risultato default dopo)


Modificato da BeaZtiE

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Hem, già che ci sei, un risultato interessante sarebbe quello della 460 singola... ancora manca!

Con riferimento alla prima parte della tua risposta, ovviamente si parlava di SB socket 1155, perché il discorso è nato in un thread in cui si configurava un computer con questo processore.

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Il fatto è che sia la 460, sia la 560 sono disponibili anche con 2GB di memoria... Mentre 470 e 570 ci sono solo con 1280MB (e la 470 l'hanno ritirata adesso). La 580 ce ne sarà una con 3GB, ma di certo non avrà la convenienza di due 460.... o 560...

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Grazie della spiegazione, quindi visto che CPU e GPU durante un render comunicano grandi quantità di dati, per avere delle buone performance è quasi d'obbligo avere un bus CPU vs GPU a x16. L'attuale socket 1155 quindi è già castrato con una sola linea x16, due schede non renderebbero al cento per cento?

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Hem, già che ci sei, un risultato interessante sarebbe quello della 460 singola... ancora manca!

Con riferimento alla prima parte della tua risposta, ovviamente si parlava di SB socket 1155, perché il discorso è nato in un thread in cui si configurava un computer con questo processore.

appena fatto:

5m 50s

460 gtx 2gb

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

La memoria non ha grande ruolo in V-Ray RT

ho provato di inchiodare il render per motivi di memoria.. (come capita con iray) pero non sono riuscito.

se faccio moelli pesanti.. resoluzione 16k x 12k texture 2-3 gb.. visto, che mi consuma una mareia di memoria di computer.. pero la memoria di sk. video non va oltre 85%

con 1,2 GB di ram..

provato stessa cosa con Quadro 4000 che ha 2 gb di ram.. la stessa cosa.. videoram rimane riempita a max 85%

quindi per me la cosa fondamentale e di avere molta ram di computer, ma no su sk. video..

questo significa, che direttamente dobbiamo escludere GTXx60 sk. video con 2 GB di ram perche hanno 2 GB di ram.. non vale.

alla fine se fai calcolo performance/prezzo GTXx70 e la sk. video piu vantaggiosa in assoluto..

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Ah si, sicuramente la 570 è ben più potente per la differenza di costo.

Ma quindi vuoi dire che Vray RT con OpenCL permette di usare la ram del computer? Questo è ciò che si diceva inizialmente, ma se non erro era stato smentito! Sarebbe importantissimo!

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Ah si, sicuramente la 570 è ben più potente per la differenza di costo.

Ma quindi vuoi dire che Vray RT con OpenCL permette di usare la ram del computer? Questo è ciò che si diceva inizialmente, ma se non erro era stato smentito! Sarebbe importantissimo!

infatti non la usa affatto.

l'ha precisato anche Vlado: se una scena non entra nella memoria della scheda video rt-gpu scala automaticamente le texture per farle entrare nel buffer.

consapevoli di ciò bisognerebbe fare una prova: render alta risoluzione con una texture molto pesante e confrontarla con la stessa texture renderizzata però su scena con molte altre texture pesanti. probabilmente la seconda mostrerà texture renderizzate di bassa qualità.

il primo che lo fa, magari anche io, posti qui :Clap03:

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Non so che gtx460 abbiate testato, ma io ho dei risultati diversi con la mia...una gainward gtx460 2gb.

7min 12s (ripetuto 3 volte, sempre uguale)

drivers 266.58

Questo tempo è circa il doppio del primo risultato, quello con 2*gtx460, quindi è anche corretto.


Modificato da thedreamers

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Non so che gtx460 abbiate testato, ma io ho dei risultati diversi con la mia...una gainward gtx460 2gb.

7min 12s (ripetuto 3 volte, sempre uguale)

drivers 266.58

Questo tempo è circa il doppio del primo risultato, quello con 2*gtx460, quindi è anche corretto.

io l'ho fatto con una scheda gemella della tua, però con core a 800mhz...

tra l'altro i driver serie 26x fanno schifo in open-cl, io uso i 258.96 che sembrano i migliori. confermato anche da Vlado dopo che gli avevo segnalato l'anomalia.

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

io l'ho fatto con una scheda gemella della tua, però con core a 800mhz...

tra l'altro i driver serie 26x fanno schifo in open-cl, io uso i 258.96 che sembrano i migliori. confermato anche da Vlado dopo che gli avevo segnalato l'anomalia.

mmh farò una prova anche io con quelli vecchi ;)

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Pero.. la formula per computer ram e videocard ram e piu meno 1:3

intendo.. se ti serve 1 GB in sk. video devi sacrafficare 3 gb di ram del sistema.

ho fatto molte prove questo estate con la alfa versione di GT OpenCL

ora la situazione e sempre uguale. comunque.. ogni macchina recente ha minimo 12 gb di ram - quindi il limite di memoria su sk. video non e un problema (prima di tutto su V-Ray RT OpenCL)

ancora nn ho chiarito con vlady come mai 1:3.. probabilmente il buffering di memoria di sistema e i tanti passagi occupano 3 volte piu spazio..

pero sempre meglio di avere alternativa - anche consumando troppa memoria di sistema, anziche inchiodo di prodotto, scena danneggiata, nessuna possibilita di rendering etc.

again chaos hann fatto vedere al mercato, che sono una ditta davvero seria e riesce a cobattere tutti i limiti di hardware attuale ;-)

Condividi questo messaggio


Link al messaggio
Condividi su altri siti

Crea un account o accedi per commentare

Devi essere un utente per poter lasciare un commento

Crea un account

Registrati per un nuovo account nella nostra comunità. è facile!

Registra un nuovo account

Accedi

Hai già un account? Accedi qui.

Accedi ora


  • Navigazione recente   0 utenti

    Non ci sono utenti registrati da visualizzare in questa pagina.

×