Jump to content
Search In
  • More options...
Find results that contain...
Find results in...
emanueletrevisani

Workstation per software Directx, GP-GPU e OpenGL…manca qualcosa ?

Recommended Posts

Mi chiamo Emanuele Trevisani; Buon giorno a tutti.

Con questo mio primo post, mi complimento innanzitutto con tutti voi della redazione di Treddi per il grande lavoro illuminante ed il continuo aggiornamento offerto quotidianamente dello stato dell’Arte in CG.

Ho tentato, leggendo decine e decine di post, di mettere insieme le idee per comporre una Workstation che potesse soddisfare al meglio le mie esigenze, ma ogni volta che arrivo a tirare il totale, leggo quel post in più che mi incasina la vita, privilegiando un aspetto piuttosto che un altro.

La continua ricerca in CG è spasmodica, ed ogni giorno esce un prodotto che necessita di risorse hardware diverse che và assolutamente sperimentato.

Vorrei “farmi assemblare” una nuova workstation a doppio monitor il cui giusto compromesso possa soddisfare questa pipeline di lavoro:

Form-z 6.5, 3ds Max design 2010 per la modellazione;

V-Ray + (prossimamente RT Gpu ed I-Ray); Maxwell Render, Keyshot2 per il rendering statico;

Lumion per animazione;

Photoshop Cs3 per post-processo e composizione;

Autocad 2009 per il 2d.

Insomma, deve essere versatile per poter lavorare e sperimentare in directx, Gp-Gpu e openGL .

Il budget va dai 1500/2300 euro escluso monitor ovviamente. Non ho una lista precisa da proporre, anche se a grandi linee provo ad esporla:

n 1 Processore I7 2600K da overcloccare.

n. 1 Scheda madre che possa accogliere una scheda video professionale quadro + 1 o 2 schede Gpu gaming;

n. 1 Hd solido per software

n. 2 HD da 1 Tera cad. per dati in Raid 1

n. 6 x 2gb. di ram

sistema operativo 64 bit

silenzioso.

Nota:

interessante il discorso workstation + nodo rendering

Grazie anticipatamente a chi vorrà aiutarmi a capire e definire questa macchina.

Emanuele Trevisani

Share this post


Link to post
Share on other sites

Ciao,

ci sono alcuni errori nella ua configurazione.

1) Ricorda che una scheda madre per sandy bridge non potrà montare più di due schede video. SB ha infatti un bus pci-e x16, che al più può essere splittato in due bus di ampiezza dimezzata, per connettere due schede video.

2) La RAM: SB ha memory controller dual channel, non triple channel. Quindi si montano o 2 o 4 banchi. Inoltre conviene di gran lunga che questi siano da 4GB, non da 2GB, per poter espandere in futuro.

Share this post


Link to post
Share on other sites

Ciao,

ci sono alcuni errori nella ua configurazione.

1) Ricorda che una scheda madre per sandy bridge non potrà montare più di due schede video. SB ha infatti un bus pci-e x16, che al più può essere splittato in due bus di ampiezza dimezzata, per connettere due schede video.

2) La RAM: SB ha memory controller dual channel, non triple channel. Quindi si montano o 2 o 4 banchi. Inoltre conviene di gran lunga che questi siano da 4GB, non da 2GB, per poter espandere in futuro.

Share this post


Link to post
Share on other sites

Grazie Papafoxtrot delle tue precisazioni.

Ho indicato il processore sandy bridge per il suo interessante rapporto qualità prezzo che riduceva non poco il costo della macchina, ma se cio' và a discapito della possibilità di scalare la macchina o di attrezzarla con le dovute schede video non è certo questa la scelta che vorrei fare.

Cio' che volevo capire, è il rapporto schede video/cpu/Mobo in funzione del software della mia pipeline di lavoro oltre che della volontà di fare una workstation che mi segua 3 anni e sia come dire, "ready", a tutte le possibilità che offre il mercato; directx - Gp-Gpu - OpenGl

Per esempio, è molto interessante la Mobo Evga di cui si parla nel post di 3dr, altamente scalabile, forse troppo per me, nessun problema all'acquisto di I7 980x, nessun problema per 12/16/24 GB di ram.; ma quale configurazione per le schede video?

è giusto una quadro 2000 + una gtx 460 2 gb. o la gtx 570 con la possibilità per entrambe di raddoppio? oppure può andare bene ed avanzare una quadro 2000 con i suoi 192 core Cuda

Pendo dalla tua capacità di sintesi in funzione delle infinite variabili dell'argomento.

Grazie Papafoxtrot!

Emanuele Trevisani

Share this post


Link to post
Share on other sites

Ciao,

non ti dico assolutamente di scartare il 2600k per la limitatezza nell'espansione delle schede video.

Alla fine devi considerare che se cercassi una CPU con prestazioni simili (considerato anche l'overclock) dovresti rivolgerti al 980x. E allora spenderesti di botto 700 euro in più per la sola CPU.

A quel punto con quei 700 euro, faccio sempre notare, assembli un'interno nuovo nodo con core i7 2600k.

Il che vuol dire che per renderizzare su CPU sei molto più veloce, e per quanto riguarda le GPU ne monti udue solo sul nuovo nodo...

Considera anche che ora prendi il computer con una quadro, che potrebbe essere una 600 o una 2000. In futuro aggiungerai una scheda che potrebbe essere una gtx560 2GB... Prima che tu senta la necessità di prendere una nuova scheda (per ora con ray rt si fanno solo prove, che in genere non sono pesantissime) probabilmente avrai già cambiato computer.

Sennò lo cambierai... ovvero: cambierai CPU e scheda madre. Sarà la volta di Bulldozer X8 o di sandy bridge LGA2011...

Share this post


Link to post
Share on other sites

aspettiamo il Sig. Papafoxtrot, ma forse servirebbe una scheda tipo la "vecchia" MSI P55A-GD65 che aggiungeva il chip Hydra, per aumentare il numero delle linee pciXpress da dedicare alle schede video.

forse MSI ne proporrà una simile anche per la nuova P67A-GD65?

Share this post


Link to post
Share on other sites

1) Ricorda che una scheda madre per sandy bridge non potrà montare più di due schede video. SB ha infatti un bus pci-e x16, che al più può essere splittato in due bus di ampiezza dimezzata, per connettere due schede video.

Questa non la sapevo...

Comunque realizzano schede con chip N200 aggiuntivo che gestisce altre due schede e il triple sli, ad esempio la Asus Maximus IV Extreme che non è certo economica ( sui 340 euro, ma si risparmia sulla CPU) ma ha quattro linee x16 e ampio supporto all'overlock, più tante altre features. Quindi può essere garantito un upgrade GPU veramente notevole, anche se non ho ben capito se si possono mettere quattro schede, ma credo di si.


Edited by enri2

Share this post


Link to post
Share on other sites

Si si, le soluzioni ci sono. Come questa.... nf200 è l'analogo del chip Hydra Vision. Certo non sono features presenti in tutte le schede ecco.

Poi se monti 3 schede video (perché su quella mobo 4 non ce ne stanno, essendo 3 slot attaccati), comunque loro dichiarano X16 su ogni slot, ma questo è un parametro un po' fittizio, nel senso ceh è solo l'ampiezza di bus che connette la scheda al chip Hydra o nforce 200. Il chip poi amministra il traffico tra le schede e tra schede e CPU, e alla fine dato che in modalità SLI/crossfire c'è un certo scambio di dati tra le schede, ogni scheda usufruisce di più della metà banda che avrebbe se fosse connessa direttamente al controller e dunque alla CPU.

Ma nel caso di un render, ad esempio, la banda è importante solo per trasferire i dati della scena da renderizzare dalla CPU alla scheda video. Dunque il traffico è ad una sola direzione e non c'è scambio di dati tra le CPU.

Quindi alla fine con n schede, ogni scheda ha comunque 1/n volte la banda che esce dalla CPU. Con tre schede invece che 16x hai poco più di 5x.

Che può essere controproducente... Guarda i tempi di caricamento della scena sulla scheda video. Spesso sono confrontabili con i tempi di render, dato che soprattutto con vray rt (di cui parliamo qui) la scena viene renderizzata per test a settaggi non altissimi. Quindi se dividi in due o in tre la banda rischi di raddoppiare o triplicare questi tempi, a svantaggio del tempo ri render totale...

Insomma bisogna ponderare bene vantaggi e svantaggi. In questi casi potrebbe essere meglio una VGA potente che due inferiori. Ad esempio una GTX570 o 560 anziché due 460, anche se queste due ina ssoluto sono più potenti e costano uguale.


Edited by papafoxtrot

Share this post


Link to post
Share on other sites

Quindi alla fine con n schede, ogni scheda ha comunque 1/n volte la banda che esce dalla CPU. Con tre schede invece che 16x hai poco più di 5x.

Il conto non l'ho capito... :huh:

Quindi dici che se la CPU gestisce solo un x16 di conseguenza è questo bus che si distribuirà alle schede...ma allora l'Nforce che ci sta a fare solo per lo sli?

Credevo fosse a supporto proprio al limite del bus della CPU, che a questo punto sta diventando un vero impedimento per avere più schede, va bè che con due 580 diciamo che abbiamo risolto, ma per chi deve mettere una Quadro diventa un problema se vuole prestazioni GP-GPU al top.

In questo caso poi Lumion ha bisogno della sli per far lavorare due schede.

Per le quattro schede ho capito che è solo una questione di spazio, a parte il discorso sul bus...ma non potevano allargare? :)

PS- Noto adesso che c'è un sistema per overloccare da remoto, con collegamento diretto alla motherboard dal'iPhone/iPad!

Che beffa, dall'iPhone puoi overloccare un PC, ma è impossibile overloccare un mac. :)


Edited by enri2

Share this post


Link to post
Share on other sites

Posto alcuni chiarimenti sulla questione bus:

"Asus ha scelto di implementare 4 slot PCI Express 16x sulla scheda Maximus IV Extreme, integrando anche chip NVIDIA NF200 così da fornire supporto alla tecnologia Triple SLI. Se viene utilizzata una sola scheda video PCI Express questa deve essere installata nel primo slot, ricevendo segnale elettrico 16x. Per due schede video in parallelo devono venir utilizzati il primo e il terzo slot PCI Express 16x, ciascuno con segnale 8x elettrico, mentre con tecnologia Triple SLI gli slot da utilizzare sono il primo, il secondo e il quarto. In quest'ultima configurazione il primo slot gestisce segnale PCI Epxress 8x elettrico, mentre i due restanti ricevono segnale 16x elettrico proveniente dal chip NVIDIA NF200. Notiamo inoltre nella parte inferiore del PCB un connettore di alimentazione Molex a 4 pin: serve per fornire alimentazione supplementare agli slot PCI Express 16x, utile proprio in presenza di configurazioni multi GPU."

Quindi con tre schede uno riceve x8 e gli altri due x16 dal chip Nf200.

La scena in questa configurazione viene caricata al minimo della velocità disponibile se non erro, quindi a x8, che è più che sufficiente tra l'altro.

Il Triple sli come può funzionare con bus diversi? Ma credo non sia un problema, avevo letto che la differenza di prestazioni in sli tra x8 e x16 è trascurabile.

Share this post


Link to post
Share on other sites

Non hai capito il discorso che facevo.

Il chip nforce 200 funziona in questo modo.

Da una parte si connette 16 alla CPU.

Dall'altra si connette 16x alle due schede video.

Dunque ogni scheda video ha un bus 16x fino al chip, che pulò usare per comunicare con la CPU oppure con l'altra scheda connessa all'nforce 200.

Questa cosa è vantaggiosa perché nei collegamenti sli e crossfire c'è un certo interscambio di dati tra le schede, quindi anche se la CPU ci mette solo un 16x, si può comunque aumentare la banda alle due schede, e dunque coprire quella domanda di banda necessaria per fli scambi tra le due schede.

Ma il bus che va dal processore all'nforce 200 è sempre solo un 16x.

Quindi in pratica ogni scheda video riceverà dalla CPU un 8x, e avendo un bus 16x fino all'nforce 200, avrà altri 8x utilizzabili, ma solo per comunicare con l'altra scheda video.

E' come avere due strade a 4 corsie che finiscono in un'unica strada a 4 corsie.

Tutto funziona bene finché metà del traffico sulle due prime strade rimane confinato tra queste due.

Nel caso del render le due schede non comunicano tra di loro! Tutto il volume di traffico va sempre e solo dalla CPU alle due schede. E dato che dalla CPU esce un 16x tu non potrai mai fare nulla per allargarlo. La strada singola è sempre a 4 corsie sole, il fatto che le due strade che si diramano facciano 4 ciascuna non vuol dire niente, il collo di bottiglia viene prima!

Quindi nvforce 200 in questo caso ci serve solo per poter collegare piùdi due schede, limite che ha posto intel alla suddivisione del bus uscente dalla CPU. Poi che il bridge offra due 16x alle due schede connesse, questo da un vantaggio solo in presenza di traffico tra le due schede, che nel nostro caso non c'è.

Poi la scheda madre può avere diversissime configurazioni: con due bridge nf200 puoi collegarti ad ognuno con un 8x dalla CPU e da questo ripartire con due bus verso le schede video. Se colleghi due vga le attacchi allo stesso nf200 e hai 16x dalla cpu al chip e 16x su ogni scheda.

Se colleghi 4 vga hai 8x dalla CPU ad iognuno dei due chip e 8x da ognuno di questi alla sua scheda video.

Ma il problema è sempre a monte. Con quattro schede video la strada che esce dalle GPU è la classica tangenziale a 8 corsie che finisce in una fila di semafori... C'è sempre la CPU con i suoi soli 16x dall'altra parte!

Share this post


Link to post
Share on other sites

Ragazzi scusate, io stò alla finestra nell'attesa che deliberiate se questa Mobo fà al caso; le mie conoscenze tecniche mi permetterebbero al più (e credetemi, lo farei molto volentieri), di offrirvi qualcosa da bere; da cui cercavo una emoticons con la piva.

A parte gli scherzi, grazie per l'analisi della questione che state portando avanti.

Emanuele Trevisani

Share this post


Link to post
Share on other sites

Diciamo che adesso mi è più chiaro :)

Resta da capire quanto traffico in render vada dalla CPU alle GPU. Radiance in un post, ovviamente per quanto riguarda Octane, diceva che un x4 sarebbe addirittura sufficiente poichè si tratta solamente di caricare la scena, ma stiamo parlando di Cuda solo GPU, per i motori che usano anche CPU CUDA o OpenCL che sia, credo sia diverso. Sarebbero utili dei test in tal senso.

Share this post


Link to post
Share on other sites

Con una scheda madre che dichiara due pciex16 (PCIEX16_1, PCIEX16_2) e due pciex8 (PCIEX8_1, PCIEX8_2), non si possono quindi mettere 3 schede? la quadro magari su PCIEX16_1 e le due gtx su PCIEX16_2 e PCIEX8_2? IO credevo di si

(specificatamente si tratta della Gigabyte GA-P67A-UD7)


Edited by elvios

Share this post


Link to post
Share on other sites

questa scheda "imminente" puo' risolvere il problema?

post-46789-026942400 1296064667_thumb.jp

La EVGA P67 Classified è una mainboard che dispone di 6 slot PCI-eXpress pilotati dal nF200 in grado di funzionare tutti contemporaneamente con collegamenti a 5 x x8 + 1 x x4 e di supportare ufficialmente le configurazione 3-way SLI con switch a 2 x x16 + 1 x x8. La circuiteria di alimentazione è a 12-fasi ma non è di tipo Digital-PWM come sulla P55 Classified.

Share this post


Link to post
Share on other sites

Però mi pare di aver capito che il problema è del processore, che quindi non consentirebbe più di un due x4 e un x8, GPU+CPU.

Cioè le schede ce le metti, ma comunicano lentamente.

A questo punto quali sono le CPU che permettono 3 schede video almeno a x8? se ce ne sono?


Edited by elvios

Share this post


Link to post
Share on other sites

Suppongo gli esacore i7, ma non credo però che sia tutto questo gran problema, tre schede in sli che dovrebbero anche andare bene in GP-GPU, non sono cosa da poco.

Lo sli funziona di sicuro, per il gp-gpu sicuramente funziona, ma non conosco le "dinamiche" cpu-gpu, un solo x16 può pregiudicarne il funzionameto? Io dico che se la scena viene caricata totalmente nella gpu, la cpu non interviene più di tanto durante il calcolo se le schede sono le uniche a calcolare, ma sono nel campo delle ipotesi...:)

Share this post


Link to post
Share on other sites

Radiance dal Forum di Octane:

"Octane only transfers large amounts of data once you click on the meshnode,

after that it only sends small commands and little bits of data, so the pci-bus speed is not that important.

it will even work on a 1x speed, but it might take 2-3 minutes to load the model into your GPU on the first click and you will get some lag when changing material nodes/params.

Once it's in the gpu there really is'nt much traffic over the PCI-E bus"

Qundi è all'inizio che eventualmente serve la banda per trasferire la scena, dopo il traffico si riduce molto, se c'è.

Per i render che usano anche la CPU non saprei proprio, ma non credo cambi molto, ognuno dovrebbe fare il suo lavoro con la scena che ha.

Share this post


Link to post
Share on other sites

Mi pare di capire ci siano troppe incognite,

poi magari con i driver sarà ancor peggio...

comunque sia devo acquistare.

la soluzione sarebbe la seguente:

sch.madre: Gigabite ga67a-ud4

ram: Corsair 4x4Gb ddr3 1600

cpu: I7 2600k

Sch.video: 2 x GTX570 SLY

HD sistema: 120 gb ssd ocz vertex2

HD dati: 2 x samsung F3 1Tb.

Alimentatore: Corsair Hx 650 W

Case: Antec P183

Ventole: Scynte 4x12cm

Dissipatore: Prolimatech Megahalems

S/o: windows 7 Prof. 64 bit

se non sarò soddisfatto, farò un rendernode con le due GTX che sostituirò con una quadro 2000

Che ve ne pare ?

Share this post


Link to post
Share on other sites

Lo sli non serve per il render GPU, il sw trova tutte le schede disponibili e manda la scena per essere calcolata, ma a te potrebbe servire per Lumion, che usa un game engine.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Restore formatting

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.


  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...
Aspetta! x