Mnemonische phrase (24 Wörter) 3-Mal das gleiche Wort? Wahrscheinlichkeit berechnen?

Hey Leute,
ich habe mir gerade eine neue „mnemonische phrase“ also 24 neue Wörter generiert, meine Frage ist nun von den 24 Wörtern ist ein Wort 3 Mahl das Gleiche meine Frage ist nun wie wahrscheinlich ist es das man 3-mal das gleiche Wort innerhalb von 24 Worten aus einer Liste von 2048 Wörtern zieht.

Ich würde mir es ja selbst berechnen, leider weiß ich nicht wie ich da anfangen soll.

Ich hoffe hier ist jemand der besser in Mathematik ist als ich…

Freue mich auf eine Antwort.

Wir rechnen da mal nur mit 23 Wörtern, da das 24. Wort durch die Checksumme sowieso eingeschränkt ist und keine 2048 Wörter in Frage kommen.

Die Wahrscheinlichkeit können wir mit Bernoulli ausrechnen, Trefferwahrscheinlichkeit p=\frac{1}{2048} bei n = 23 Versuchen.

P(X=3) = \binom{23}{3} * \frac{1}{2048}^{3} * \frac{2047}{2048}^{20} \approx 0,0000204 \%

Sehr unwahrscheinlich.

Aber das Ergebnis kannst du so nicht auf die Mnemonic anwenden, durch die Checksumme kann die Wahrscheinlichkeit nochmal anders aussehen.

Außerdem generiert deine Wallet keine Mnemonic indem sie zufällig Wörter auswählt!

Und kann natürlich auch sein dass ich da oben kompletten Unfug veranstaltet habe…

3 „Gefällt mir“

Hätte das auch über ein klassisches Bernoulli-Experiment gerechnet und sollte so passen! :+1:t3:

2 „Gefällt mir“

Anmerkung:
Diesen Beitrag kann man nur vernünftig am PC oder Tablet lesen. Oder am Smartphone im Querformat, da sonst die Formeln einfach hinten abgeschnitten sind.

Je nachdem welche Wahrscheinlichkeit man berechnen möchte (exakte Definition), kann man das so oder so ähnlich machen.

Du hast berechnet, dass genau ein bestimmtes Wort genau 3 Mal vorkommt, wobei alle anderen Wörter beliebig oft vorkommen dürfen.

Ich denke interessanter ist die Wahrscheinlichkeit, dass ein beliebiges Wort mindestens 3 Mal vorkommt.

Wenn man sich nicht auf ein bestimmtes Wort festlegt, sondern ein beliebiges Wort genau 3 Mal vorkommen soll, ist die Wahrscheinlichkeit um einen Faktor 2048 größer als oben berechnet:

P_{beliebiges~Wort,~genau~3~Mal} = 2048 \cdot \binom{23}{3} \cdot (\frac{1}{2048})^{3} \cdot (\frac{2047}{2048})^{20} \approx \textbf{0,0418 %}

Hierin sind immer noch nicht die Fälle berücksichtigt, dass mindestens ein Wort öfter als 3 Mal vorkommt, und in den 23 Wörtern kein Dreifachwort enthalten ist. Es muss immer mindestens ein Wort genau 3 Mal vorkommen.

Am Ergebnis für P ändert sich allerdings nicht mehr viel, wenn man auch noch die Fälle mitberücksichtigt, dass Wörter öfter als 3 Mal vorkommen dürfen, und es keine Dreifachwörter gibt. Es wird aber wesentlich komplizierter zu rechnen.

Wenn man auf die Idee kommt, bei den restlichen 20 Wörtern einfach alle 2048 Wörter zuzulassen, macht man einen Fehler.

P_{beliebiges~Wort,~mind.~3~Mal} \neq 2048 \cdot \binom{23}{3} \cdot (\frac{1}{2048})^{3} \cdot (\frac{2048}{2048})^{20} \approx 0,0487~\%

Dabei werden Fälle mehrfach gezählt.

Stattdessen muss man selbst kombinatorisch tätig werden.

Man kann das Vorgehen verallgemeinern, wenn man für kleine Werte von n die Wahrscheinlichkeit berechnen möchte, dass mindestens ein Wort mindestens n Mal vorkommt:

Zuerst werden die einzelnen Wahrscheinlichkeiten berechnet, dass mindestens ein Wort genau 1 Mal, genau 2 Mal, …, genau (n-1) Mal vorkommt, aber kein Wort öfter. Anschließend werden diese Einzelwerte von 1 abgezogen, also die Wahrscheinlichkeit des Gegenereignisses berechnet.

Beispiele:

Wahrscheinlichkeit, dass ein beliebiges Wort mindestens 2 Mal vorkommt

Wir berechnen also zuerst die Wahrscheinlichkeit P_{1}, dass mindestens ein Wort genau 1 Mal vorkommt, aber kein Wort öfter als 1 Mal. Im Klartext, dass alle Wörter unterschiedlich sind.

P_{1} = \frac{1}{2048^{23}} \cdot \binom{2048}{23} \cdot 23! \approx 88,3389~\%

P_{beliebiges~Wort,~mind.~2~Mal} = 1 - P_{1} \approx \textbf{11,6611 %}

Wahrscheinlichkeit, dass ein beliebiges Wort mindestens 3 Mal vorkommt

Wir berechnen zuerst die beiden Wahrscheinlichkeiten P_{1} und P_{2}, dass mindestens ein Wort genau 1 Mal vorkommt, aber kein Wort öfter als 1 Mal (alle Wörter unterschiedlich), und dass mindestens ein Wort genau 2 Mal vorkommt, aber kein Wort öfter als 2 Mal.

P_{1} = \frac{1}{2048^{23}} \cdot \binom{2048}{23} \cdot 23! \approx 88,3389~\%

Bei P_{2} könnte man auf die Idee kommen so zu rechnen:

P_{2} \neq \frac{1}{2048^{23}} \cdot \binom{2048}{22} \cdot 22! \cdot \binom{23}{2} \approx 11,0315~\%

Das entspricht der Wahrscheinlichkeit, dass man 2 aus 23 Wortplätzen auswählt, die identisch sein sollen, und anschließend 22 Wörter auf die freien Plätze verteilt.

Man vernachlässigt aber die Fälle, in denen es bei den restlichen Wörtern auch Wortpaare gibt. Die Fälle von einem Paar, zwei Paaren, bis hin zu 11 Paaren müssen aufaddiert werden:

P_{2} = \frac{1}{2048^{23}} \left[ \binom{2048}{22} 22! \binom{23}{2} + \binom{2048}{21} 21! \binom{23}{2} \binom{21}{2} \frac{1}{2!} + ... \\ ... + \binom{2048}{12} 12! \binom{23}{2} \binom{21}{2} \binom{19}{2} \binom{17}{2} \binom{15}{2} \binom{13}{2} \binom{11}{2} \binom{9}{2} \binom{7}{2} \binom{5}{2} \binom{3}{2} \frac{1}{11!} \right] \approx 11,6192~\%

Damit erhält man das Ergebnis:

P_{beliebiges~Wort,~mind.~3~Mal} = 1 - P_{1} - P_{2} \approx \textbf{0,0419 %}

Das Ergebnis ist fast identisch zum Wert für P_{beliebiges~Wort,~genau~3~Mal}, das oben sehr einfach berechnet wurde. Der zusätzliche Aufwand für mindestens 3 Mal gegenüber genau 3 Mal ist also nicht unbedingt gerechtfertigt. :slight_smile:

Man weiß das zwar erst nachher, kann es sich aber denken, da die Wahrscheinlichkeit für n-fache Wörter für größere n stark abnimmt.

Bei größeren n kommt bei der mindestens n Mal Methode noch mehr Komplexität ins Spiel. Man muss dann nicht nur berücksichtigen, dass mehrere Wörter n-fach auftreten können, sondern n-fach, (n-1)-fach etc. .

6 „Gefällt mir“

Wow! :grinning:

Jetzt könnte man noch einen ganzen Roman drüber schreiben wie sich die Wahrscheinlichkeit durch das 24. Wort nochmal ändert. Kann man ja, da es immer ein bestimmtes Set an Wörtern für die Checksumme gibt, auch ausrechnen. Aber alleine der Gedanke daran verursacht bei mir schon Kopfschmerzen…

Was hat Basti sich nur dabei gedacht MathJax einzuschalten… :sweat_smile:

1 „Gefällt mir“

ahhhhh… meine Gehirn CPU ist bei dem Versuch dir zu folgen zu heiß geworden und ist nun im Emergency Shutdown. :joy:

3 „Gefällt mir“

Ich würde aus dem Bauch heraus sogar vermuten, dass eine Rechnung mit 24 unabhängigen, zufälligen Wörtern näher an der Realität liegt, als eine mit 23 Wörtern.

Die ersten 3 Bit des 24. Worts sind schon zufällig. Und die restlichen 8 Bit basieren auf einer Checksumme, wobei der zugrundeliegende Hash-Algorithmus SHA-256 denke ich sehr gut pseudo-zufällige Zahlen liefert. Aber du hast natürlich recht, dass das nicht das gleiche ist.

Die Ergebnisse bei 23 Wörtern und bei 24 Wörtern sind übrigens nahe beieinander.

Wahrscheinlichkeiten bei 23 zufälligen Wörtern:

  • Mindestens ein Wort 2 Mal oder öfter:  11.6611 %
  • Mindestens ein Wort 3 Mal oder öfter:    0.0419 %

Wahrscheinlichkeiten bei 24 zufälligen Wörtern:

  • Mindestens ein Wort 2 Mal oder öfter:  12.6532 %
  • Mindestens ein Wort 3 Mal oder öfter:    0.0479 %
4 „Gefällt mir“