Wortle/Word-Guessing-Game Wortliste erstellen

Hier zeige ich wie man sich Wortlisten erstellen kann. Dies habe ich für das Spiel Wortle/Word-Guessing-Game gebraucht. Ich gehe hier am Beispiel von einer deutschen Wortliste aus. Die müsste aber auch mit anderen Sprachen funktionieren.

Zuerst benötigt man eine vollständige Wortliste in der gewünschten Sprache. Ich habe hier ein bereis vorgefertigtes Script auf Github verwendet. Danke an Davidak!

Clont das Repository und macht das Script ausführbar.

git clone https://github.com/davidak/wortliste

chmod +x wortliste-generieren.sh

Dann führen wir das Script aus.

bash wortliste-generieren.sh

Das Script läd nun die Wortlisten von Digitales Wörterbuch der deutschen Sprache, Berlin-Brandenburgischen Akademie der Wissenschaften, Leipzig Corpora Collection (LCC), Wortschatz-Projekt der Universität Leipzig, DeReWo – Korpusbasierte Grund-/Wortformenlisten, Institut für Deutsche Sprache herunter und speichert sie in der Datei "wortliste.txt" ab.

Jetzt haben wir eine Liste mit ca. 20000 Wörtern. Diese müssen wir jetzt so aussortieren dass wir nur Wörter mit 5 Buchstaben, ohne Umlaute und Akzentzeichen erhalten.

Hier habe ich die Befehle die Ihr im Terminal ausführen könnt:

alle Wörter mit Ü entfernen:

sed -i '/Ü/d' wortliste.txt

alle Wörter mit ü entfernen:

sed -i '/ü/d' wortliste.txt

alle Wörter mit Ä entfernen:

sed -i '/Ä/d' wortliste.txt

alle Wörter mit ä entfernen:

sed -i '/ä/d' wortliste.txt

alle Wörter mit Ö entfernen:

sed -i '/Ö/d' wortliste.txt

alle Wörter mit ö entfernen:

sed -i '/ö/d' wortliste.txt

Dies machen wir jetzt noch mit den Akzentwörtern. Bitte passt den Code einfach an und entfernt noch è à ù ò sowie é und â, ê, î, ô, û .

Jetzt ist die Wortliste schon mal minimiert. Jetzt müssen wir noch die Wörter herausfinden die genau 5 Buchstaben haben. Dies machen wir mit

grep '^.....$' wortliste.txt > wortliste5german.txt

Das Ergebnis liegt nun in einer neuen Datei. Ich habe die Datei wortliste5german.txt benannt.

Für das Spiel Word-Guessing-Game benötigen wir vor jedem Wort ein " und nach jedem Wort ein ",

Ebenso müssen alle Wörter in Kleinbuchstaben vorhanden sein.

dies machen wir so:

sed -i 's/^\(.\)/"\1/' wortliste5german.txt

sed -i 's/.*/&",/' wortliste5german.txt

sed -e 's/\(.*\)/\L\1/' wortliste5german.txt > wortlistefinalgerman.txt

Nun haben wir aus ca. 20000 Wörtern ca. 2800 gemacht, genau so wie wir sie brauchen. Die Datei "wortlistefinalgerman.txt" kann jetzt in den Code des Spiels eingebunden werden.