Workstation crashes, kapotte voeding?

Status
Niet open voor verdere reacties.

jorism1993

Gebruiker
Lid geworden
28 apr 2009
Berichten
128
Ik ondervind problemen als ik mijn workstation zwaar belast. Ik heb een systeem met 4x 1080Ti en als ik deze ongeveer 60 tot 75 minuten intensief gebruik, crasht mijn systeem. Ik heb de crash eigenlijk nog nooit zien gebeuren omdat ik de kamer verlaat als het systeem zware workloads draait, maar als ik terugkom om in te checken, blijkt het een stroomstoring te hebben gehad (wat niet het geval is, er zijn geen stoppen doorgeslagen): het systeem staat uit.

Interessant is dat ik het systeem alleen opnieuw kan opstarten als ik de kabel fysiek uit de voeding trek, ongeveer 5 seconden laat staan en dan weer installeer. Omdat dit alleen gebeurt onder zware belasting (max. 1250W uit de muur), zou dit de "over current protection" of "over power protection" van de voeding kunnen zijn?
 
Wat zijn de temperaturen van je CPU?
Wat gebeurt met crashen? Freeze, of (ook) een BSOD? En zo ja, wat zie je dan?
 
Voeding of temp. beveiliging lijken mij de meest logische oorzaken op basis van gegeven probleem-omschrijving.
Zaak is dus om als 1e de temp. te monitoren en er bij te blijven tot het weer gebeurd..
Die 2 minuten wachten lijkt niet teveel gevraagd.

Je zou ook eens WhoCrashed kunnen draaien, wellicht geeft dat een mogelijke oorzaak..?
 
De link met CPU temperaturen heb ik nog niet gelegd, ik zal die ook monitoren.

Wat er precies gebeurt met de crash weet ik niet, ik ben er dus nog nooit bij geweest.

Ik gebruik Ubuntu 20.04, is er een vergelijkbaar programma als WhoCrashed voor linux?
 
Aaahh, dat had je dus niet vermeld...dan had je deze vraag beter in de Linux sectie kunnen stellen...
Maar Crash is een tool die vrijwel hetzelfde doet maar dan voor Linux.
 
Ik zou het ook op windows kunnen proberen, er staat een dual boot op die PC. Ik zal eens proberen Prime95 te draaien voor een uurtje om te kijken of het probleem aan oververhitting van CPU ligt.
 
Hallo

" alleen opnieuw kan opstarten als ik de kabel fysiek uit de voeding trek, ongeveer 5 seconden laat staan en dan weer "

Dit zijn inderdaad de symptomen van een voeding die in fout is gekomen.

Een overbelaste voeding , of een thermisch probleem van deze is een mogelijkheid.

Geen vermelding merk/typenr/ouderdom van deze ....:eek:

Draaien alle ventilatoren wel soepel , en zijn deze stofvrij ???

C.p.u. /voeding , en zeker deze van de videokaarten controleren ...


Peter
 
Je moet niet alleen naar het totale vermogen kijken .. maar ook bij welke spanningen het vermogen verdeeld is.. ver de diverse aansluitingen
Stel 1500 W is OK... maar de 12V rail kan alleen dat leveren wat op het plaatje staat...
Dus wordt die video kaart wel voldoende gevoed en via welke aansluiting gaat dat?
Zoek dat eens uit.

Ik zie al heel snel 12V bij 70A .... is 840 W op een 12V lijn...
Hoe krijgt de videokaart de stroom? Vie 1 of meer aansluitingen? En hoeveel stroom is er over op die lijnen....

Mss overbelast je juist wel een deel van de voeding... dan zul je toch aan aanpassing moeten doe of een zwaardere voeding die op die aansluiting v/d videokaart wel het vermogen kan leveren wat die vraagt..

Het plaatje volgens Tweakers wat op jouw supply moet zitten:
2000944781.jpeg
 
Laatst bewerkt:
Dank je wel voor de reacties.

Ik ga er zo naar kijken. De crash treedt pas op na 60-75 minuten, maakt dat een probleem met de voeding van een videokaart minder aannemelijk? Omdat het eerst een tijd wel goed werkt?
 
Als het systeem op het randje een tijd goed werkt... hoe stabiel is dat punt als het af en toe net over die grens gaat.. dan loopt het systeem tav dat punt op zijn tenen...... en bij veel zaken is het nu eenmaal zo.. don't push it....:eek:
 
Dat plaatje staat inderdaad op de zijkant van mijn voeding. Dit plaatje staat op de achterkant:
20201109_100910.jpg
De blauwe connectors zijn de GPU's. Er zitten 3 GPU's op rails 2, en 1 GPU + mobo + CPU + harde schijven op rails 1. Na uitvallen is de voeding wel warm, maar niet buitengewoon heet.

Ook heb ik iets meer informatie over de crash. Het systeem valt gewoon uit. Ik heb er een video van gemaakt. Actie rond 2:10.
[video]https://photos.app.goo.gl/dnuVgHC5tBzJBGVX6[/video]
 
Laatst bewerkt:
Op het net vind ik dat de GTX 1080 Ti bij vollast ruim 300 Watt kan consumeren ( bron ) ...x3 kaarten op 1 12V rail maakt 900 Watt, dat is dus ruim meer dan 12V2 zou kunnen leveren ( 840 Watt )...
Aangezien de rest van de info omtrent het systeem ontbreekt ( processor o.a. ) is niet te zeggen wat de totale belasting op 12V1 zou zijn maar ik vermoed dat het wel eens hoger zou kunnen zijn ( in de piek ) dan het gecombineerde vermogen van de voeding over de 2 12V rails toelaat ( 1440W/120A ).
Mijn vermoeden gaat dus in 1e instantie uit naar de overbelastingsbeveiliging.

Om te testen zou je eens 1 van de GTX 1080 Ti kaarten eruit kunnen halen en kijken wat er dan gebeurd...
Mocht hij dan nog uitvallen dan moet je het ergens anders zoeken en dan lijkt een temp. beveiliging een logische volgende mogelijke oorzaak.
 
Laatst bewerkt:
Om wat meer info te geven op de rest van het systeem:

Processor: Threadripper 1920X
Moederbord: Gigabyte Aorus x399 Pro
64GB DDR4-3200
3 SSD schijven
2 HDD schijven
1 NVMe schijf
4 case fans
NZXT x52 AIO
 
Laatst bewerkt:
En nu: Hoeveel stroom/vermogen mag je uit die 4 PCIE aansluitingen halen?
Als dat bijv ruim de helft va het totaal is dan hoeft de voeding nog niet echt heet te worden maar kan de vraag v/d videokaart toch te groot zijn.

Of... je hebt last van een instabiele voeding of een instabiele videokaart die je systeem laat crashen?
Je hebt niet ergens een (niet permanente) sluiting agv verkeerd klemmen die je systeem bij warmer worden agv een tijdelijke sluiting (??) laat crashen? Dat laatste is wel speculatief.
Je zult zelf nog meer moeten gaan waarnemen of tijdelijk componenten uitwisselen, etc.

Edit:
de CPU komt max iets over de 300W
Bron: https://www.guru3d.com/articles-pages/amd-ryzen-threadripper-1920x-review,8.html

4x 1080Ti ===> 4x 250 W max = 1000 watt....
https://www.tomshardware.com/review...nted the GeForce GTX,manages to hit very well.
https://www.geforce.com/hardware/desktop-gpus/geforce-gtx-1080-ti/specifications

Dus je hebt niet zoveel ruimte over...

Maar die video had je de pc eerst gestrest... want tijdens de video was je niet bezig... en dan lijkt me dat de max-waarden niet gehaald worden...
En dan lijkt het meer op instabiliteit....toch, whatever de oorzaaak ook is?
 
Laatst bewerkt:
Wat bedoel je precies met: "Hoeveel stroom/vermogen mag je uit die 4 PCIE aansluitingen halen?" Hoe kan ik dit weten/meten?

Tijdens de video was de PC wel gestresst en was ie bezig met een zware workload. Indivduele kaarten trekken af en toe kort 280W, en vallen dan weer terug naar iets tussen de 220W en 250W.

Ik zal eens de workload op 3 GPU's draaien ipv 4. Kijken of ie dan ook uitvalt.
 
Laatst bewerkt:
Wat bedoel je precies met: "Hoeveel stroom/vermogen mag je uit die 4 PCIE aansluitingen halen?" Hoe kan dit weten/meten?
Zoek eens in de handleiding, blijkbaar is de sticker niet genoeg.
Als je zelf al ziet dat je tot 280W .. .per kaart pakt... das al meer dan de specs van 250 Watt.... per kaart betekent dus ook per stekker.... immers 4 kaarten 4 stekkers.
Totaal max dan 1120 Watt... ipv 1000 Watt.

Bel anders hun Helpdesk. Staat vast in de handleiding of online.
Tuurlijk zonde om de verkeerde spullen te vervangen om er achter te komen dat het iets anders was....
 
Met 3 kaarten lijkt het allemaal stabiel te draaien. CPU temperatuur is ook niet het probleem, die schommelt tussen de 50 en 60.
 
Hallo

"Met 3 kaarten lijkt het allemaal stabiel te draaien"

Dus toch de voeding die was overbelast ...

Peter
 
Ik vrees het ook. Ik kan een aantal oplossingen bedenken, allemaal met voor en nadelen.

1. Voortaan maar 3 vd 4 GPU's gebruiken.
2. Een tweede PSU aanschaffen om 1 of 2 van de GPU's van stroom te voorzien. Hier lees ik gemengde verhalen over, en ik heb twijfels over hoe veilig dit is. Ik laat het systeem vaak 12 uur achter elkaar s'nachts aan staan. Worst case scenario zou er brand onstaan.
3. Een nieuwe voeding met genoeg vermogen kopen. Bijvoorbeeld deze die een single 133.3A / 1500W 12V rails heeft.
4. Wat meer onderzoek doen of ik de load op de huidige PSU wat meer kan spreiden over de 2 rails. Zoals hierboven beschreven bevat rails 2 3 GPU's, en rails 1 1 GPU + CPU + rest. Ik zou kunnen onderzoeken welke van de twee rails overbelast wordt, en dan wat meer load balancing proberen te doen. Helaas kan ik de GPU's niet 2 om 2 verdelen over de rails omdat hier niet de juiste aansluitingen voor zijn. Dan zou ik een EPS naar 6 + 2 +6 pin connector moeten hebben, ik weet niet of die bestaan?

Wat denken jullie?
 
Status
Niet open voor verdere reacties.
Steun Ons

Nieuwste berichten

Terug
Bovenaan Onderaan