Redundanz für Lightning Node

Wie ist das eigentlich bei einer Raid-1 Lösung, wenn die Daten auf den beiden Festplatten nicht übereinstimmen? Also angenommen aus irgendeinem Grund haben sich einige Bits auf der einen Festplatte geändert. Kann das System dann entscheiden welche die korrekte und welche die defekte Datei ist?

Normalerweise schon. Ein vernünftiges Dateisystem schreibt Prüfsummen mit auf die Festplatte, mit denen sich feststellen lässt, wenn Bits korrumpiert sind.

1 „Gefällt mir“

Kann es sein, dass es nicht einfach oder günstig ist, eine CPU zu finden, die ECC Arbeitsspeicher unterstützt? Es gibt auf der Intel Seite zwar eine große Liste mit CPUs die ECC unterstützen, aber ein paar zufällige raus gesucht sind entweder zu teuer oder gar nicht verfügbar.
Die einzigen die ich jetzt spontan gefunden habe mit ECC Unterstützung kosten um die 400€.

Raid1 kann das nicht, ZFS ist hier die Lösung.

Sofern man nur eine private Lightning Node betreibt (um selbst Zahlungen senden und empfangen zu können), d.h. kein Routing betreibt und keine custodial Accounts oder sonstige Services für Dritte bereitstellt, reichen meiner Meinung nach folgende relativ einfache Maßnahmen:

  • automatisierte SCBs an einem anderen Ort
  • qualitativ hochwertige SSD benutzen (und SSD Gesundheit im Blick behalten)
  • falls SD-Karte benutzt wird (Raspiblitz etc.), qualitativ hochwertige SD-Karte nutzen und nicht zu lange betreiben (Verschleiß)
  • Watchtower auf einem anderen System laufen lassen (kostenlos auf einer Node eines Kumpels, ansonsten kostenpflichtigen Watchtower-Dienst in Anspruch nehmen oder VPS mieten und dort Watchtower selbst betreiben)
  • USV (unterbrechungsfreie Stromversorgung) nutzen, falls Stromausfälle nicht äußerst unwahrscheinlich sind

Mit diesen Maßnahmen ist die Eintrittswahrscheinlichkeit für einen Verlust von Funds dermaßen klein, dass ich persönlich völlig ruhig schlafen kann. Natürlich kommt es darauf an wieviele Sats ich in den Kanälen liegen habe, aber normalerweise rennt man ja auch nicht mit tausenden Euros im Portemonnaie rum…

Eins war mir aber noch wichtig:
Auch wenn ich Lightning relativ regelmäßig nutze, möchte ich sofort Bescheid wissen, wenn mit meiner Node was nicht stimmt. Ich habe daher auf meinem VPS einen Telegram-Bot laufen, der jede Stunde per cron-job die Blockhöhe meiner Node abfragt und mit mempool.space vergleicht. Passt das nicht, bekomme ich eine Telegram-Nachricht und kann zeitnah auf das Problem reagieren.

2 „Gefällt mir“

Noch ein besserer Tipp: Netdata. Überwacht fast alles auf dem System und kann dich auf vielfältige Weise darüber informieren, auch über den existierenden TG Bot.

2 „Gefällt mir“

Ok interessant! Sehr mächtiges Tool, danke für den Tipp.

Eine Frage habe ich allerdings, die ich mir jetzt nicht sofort durch Lesen der Readme selbst beantworten konnte - vielleicht weißt du das:
Das Monitoring läuft ja auf dem Pi, wie werde ich benachrichtigt, wenn der Pi nicht mehr läuft (bzw. offline ist)? Die Cloud-Lösung von Netdata möchte ich nicht benutzen, aber einen zusätzlichen Service auf meinem VPS laufen zu lassen, wäre kein Problem.

Wenn der PI selbst nicht mehr läuft, sollte eine Disconnect-Meldung über den TG Bot gesendet werden (bolt.observer macht dies beispielsweise).

Die Cloud-Lösung ist optional und für mehrere überwachte Knoten gedacht. Kein Muss sich dort einzuloggen bzw. anzumelden.

Eine Disconnect-Meldung von einem System, das nicht mehr läuft?

Momentan gucke ich halt von meinem VPS aus von außen auf den Pi, daher kann mit dem Pi sonstwas passieren, ich bekomme es mit. Diesen Vorteil möchte ich beibehalten…

1 „Gefällt mir“

Sorry, hatte mich vertan. Es gibt externe Systeme, die Nodes überwachen können und bei Disconnect alarmieren, z.B. bolt.observer. Oder eben eigene Systeme, wie du sie beschrieben hast.

Ok, also könnte ich überlegen Netdata zusätzlich zu benutzen, aber mein aktueller Bot würde dadurch nicht ersetzt. Trotzdem vielen Dank für den Hinweis auf dieses Tool, sicherlich für den ein oder anderen interessant!

Genau, Netdata deckt die Überwachung der internen Vorgänge ab. Es meldet beispielsweise, wenn die CPU über 10 Minuten hinweg 100% Auslastung hat oder wenn in einem Raid1-Array eine Festplatte ausfällt oder der RAM voll läuft. Externe Überwachung ist damit nicht abgedeckt.

1 „Gefällt mir“

Danke für die ausführliche Antwort!

Mit geht es primär erstmal darum meine funds zu sichern. Für alles weitere hab ich denk ich auch momentan noch zu wenig ahnung von der Materie.

Hat jemand schon erfahrungen mit dem service von Voltage.Cloud ? Könnte ich bei Ausfall meiner Node dort den service nutzen und relativ schnell meine node dort aufsetzen um meine funds zu sichern? Weiß das wer? Wenn ja könnte ich mir ja die Investition für einen Backup Rasperrry und SDD sparen. Des Weiteren würde es über den Service auch evtl schneller gehen?

Also vereinfacht gesagt, wenn du dich an einen Watchtower angebunden hast und deine SCB File + Seed hast kann dir eigentlich nix mehr passieren. Wenn du dann 3 Wochen brauchst um die neue Node aufzusetzen passiert trotzdem nix.
Theoretisch könnte man sich auch ne Pruned Node auf SD Karte hinlegen, die man dann nur in einen Raspi schiebt, nachsynced und damit das SCB einspielt. Aber wie gesagt, mit Watchtower hast du dann alle Zeit der Welt.

In einem Fall kann dir was passieren: Wenn die Node eines Channel-Partners auch down ist und somit auch die Gegenseite keinen forceclose durchführen kann (die Verwendung eines SCB bedeutet, dass die Gegenstelle gebeten wird einen forceclose durchzuführen). Verhindern kannst du das nur, indem du im Blick behältst, dass alle Kanäle (bzw. zumindest die, wo du signifikante Funds auf deiner Seite [=outbound capacity] liegen hast) auch funktionieren, also die entsprechende Node noch läuft.

1 „Gefällt mir“

Das hast du richtig beobachtet. ECC RAM gibt’s praktisch nur im High-End-Bereich. Laut Linus Torvalds eine Marketingstrategie von Intel, damit kleinere Serverbetreiber nicht auf günstige Consumer-Grad-Produkte umsteigen.

Falls du doch noch eine günstige Lösung findest, würde ich mich freuen, wenn du Bescheid sagst :slight_smile:

1 „Gefällt mir“

AMD Pro APUs unterstützen ECC-RAM (inoffiziell?). Mainboardhersteller wie z.B. Asus weisen dies explizit aus: [Motherboard] List of AMD Ryzen™ Processors with support for ECC memory | Official Support | ASUS Global

3 „Gefällt mir“

Stimmt wirklich. Der AMD Ryzen 5 5600 unterstützt laut offizieller Spezifikation ECC und ist für 130€ verfügbar. Und es gibt Mainboards ab 50€ die ECC unterstützen.

https://www.amd.com/en/product/11831

Mit so einem Mainboard sollte es gehen denke ich?
https://www.asrock.com/mb/AMD/A520M-HVS/index.asp#Specification

3 „Gefällt mir“