Neuer Fileserver Teil 7 - Instabil

Habe nun einige VMs installiert und angefangen alles ausgiebiger zu testen. Als ich größere Files vom alten Fileserver in die neue FreeNAS VM kopiert habe blieb das ganze System nach ein paar GB stehen. Auch beim Import einer großen VM ist mir der Server abgesürzt. Zum Ram hatte ich zwar vertrauen, da der Memtest diesmal tatsächlich lief, aber das könnte immernoch die Ursache der Probleme sein.

Ich muss mal schauen, ob ich anderes RAM zum testen besorgen kann, am besten welches, das auch in der Kompatibilitätsliste von Supermicro auftaucht.

»

vim.fault.filenotfound

Falls ihr mal eine VM, die ihr aus einem anderen ESXi exportiert habt, importieren wollt, könnte euch die Fehlermeldung aus dem Titel begegnen.

Das Problem hierbei ist meistens ein der VM zugeordnetes ISO File, das nicht mit exportiert wird. Wenn man ein OVF File hat, kann man einfach die Sektion mit dem CD-Rom Laufwerk entfernen und der Import wird funktionieren.

Bei einem OVA File wird das etwas komplizierter. Und zwar muss man dieses File erstmal entpacken. 7-Zip ist da hilfreich. Danach sollte man ein OVF und ein VMDK File erhalten. Das OVF kann nun wie zuvor beschrieben editiert werden.

»

Neuer Fileserver Teil 6 - pulsierende Lüfter

Das neue Mainboard ist da und läuft deutlich stabiler. ESXi ist installiert und ich fange an die virtuellen Maschinen einzurichten. Den SAS Controller an FreeNAS durchzureichen war kein Problem. Das neue Webinterface ist an manchen Stellen etwas merkwürdig, aber ich will mich nicht beschweren.

Etwas genervt haben die Lüfter, die laufen nur mit 300rpm und das Mainboard dachte die seien wohl kaputt und hat dann immer wieder auf 1500rpm hochgeregelt. Das lag daran, dass der minimal Wert im IPMI per Default zu niedrig gesetzt ist. Im Webinterface kann man die Werte nicht setzen, aber dafür gibt es ipmiutil, das auch in Homebrew unter MacOS oder jeder guten Linux Distribution enthalten ist. Alternativ kann man auch ipmitool nehmen.

So liest man die Lüfter aus:

ipmiutil sensor -N 192.168.0.159 -U ADMIN -P ADMIN -c -g fan
ipmiutil ver 2.95
isensor: version 2.95
Connecting to node 192.168.0.159 192.168.0.159
-- BMC version 3.50, IPMI version 2.0
 ID  | SDRType | Type            |SNum| Name             |Status| Reading
03f1 | Full    | Fan             | 41 | FAN1             | OK   | 300.00 RPM
0434 | Full    | Fan             | 42 | FAN2             | Absent | 0.00 na
0477 | Full    | Fan             | 43 | FAN3             | OK   | 300.00 RPM
04ba | Full    | Fan             | 44 | FAN4             | OK   | 300.00 RPM
04fd | Full    | Fan             | 45 | FAN5             | OK   | 300.00 RPM
0540 | Full    | Fan             | 47 | FANA             | Absent | 0.00 na
ipmiutil sensor, completed successfully

Und so setzt man die neuen Werte:

ipmiutil sensor -N 192.168.0.159 -U ADMIN -P ADMIN -n 47 -u 250:250:250:25400:25400:25500

Die 47 ist die SNum des Lüfters. Das macht man für alle und dann ist Ruhe. Evtl. muss man noch einmal den IPMI Controller resetten.

»

Neuer Fileserver Teil 5

Ok nach einigen Tests sieht es so aus als wäre Channel 1 auf dem Mainboard defekt. Alle vier RAM Riegel zeigten seltsames verhalten in Channel 1. In Channel 2 kann ich bisher keine Probleme feststellen. ESXi lies sich beim ersten Versuch installieren und derzeit läuft ein Memtest mit einem installierten Modul.

iKVM_capture-2-1

... ein paar Stunden später ...

Ja da scheint das Mainboard kaputt zu sein. Fehler bei belegtem Channel 1. Werde es zurückschicken. :(

»

Neuer Fileserver Teil 4

Alles ist zusammengebaut, der SAS Controller wurde auf IT Mode geflasht (hier gibts eine gute Anleitung für den Fujitsu D2607-A21 , aber ich hab Probleme ESXi 6.5 zu installieren. Die Installation bricht an beliebigen Stellen einfach ab und das System bleibt hängen. Fehlermeldungen gibt es keine. Einen Memtest konnte ich auch noch nicht zum laufen bringen. GRML läuft manchmal.

Ich dachte erst an einen defekten RAM Riegel, aber es könnte auch ein BIOS Setting oder nicht supportes RAM sein. In der RAM Liste von Supermicro kommen keine 16GB LRDIMMs vor. Wäre sehr ärgerlich, wenn es daran läge.

Ich werde morgen die RAM Riegel einzeln testen und wenn alle das Problem haben, wahrscheinlich einen supporteten Riegel besorgen und damit testen. Es könnte natürlich auch ein defektes Mainboard oder gar die CPU sein, aber da würde ich eher andere Fehler erwarten. Eine defekte CPU hab ich bisher auch noch keine gesehen.

»