hogyan próbáljuk megnyerni az ötöslottót?

2018. január 02. 02:49 - leahnora

Adattudományt tanulok szabadidőmben, és természetesen a pandas, numpy és matplotlib eszköztárainak felfedezésével kezdtem. Egy pár hét tanulás után, melyet egyébként egy online platformon keresztül végzek, szerettem volna összedobni egy egyszerű kis projektet, hogy lássam, hol is tartok.

Kutattam érdekes adathalmazok után az interneten, és meg is találtam az ötöslottó eredményeit, melyet hetente, a sorsolások után frissítenek. Az adathalmazban megtalálhatóak a nyerőszámok, illetve a nyertesek és nyereményeik kategóriánként (kettes, hármas, négyes vagy ötös).

Jupyter Notebook segítségével végeztem a minimális adattisztítást és az elemzéseket, de készítettem egy szebb formátumú riportot az eredményekről.

A notebook fájl megtalálható itt, a riport pedig itt.

Egy jól kinéző riportot szerettem volna készíteni, nem feledve azt, hogy ne csak számokat dobjak az olvasó elé, hanem inkább egy teljes történetet adjak át. Jah, és jó tudni, hogy a lottó 2017-ben volt 60 éves! :)

Tudva azt, hogy sok ember a saját szerencseszámaival játszik, legyenek azok a családi szülinapok, házszámok, stb, próbáltam néhány egyéb stratégiát összegyűjteni és elemezni hatékonyságukat:

  • leggyakrabban húzott számok
  • legritkábban húzott számok
  • legrégebb óta nem húzott számok

Kíváncsi voltam természetesen a telitalálatos nyereményekre is, de főként arra, hogy az évek során hogyan növekedtek a nyeremények. Szerencsétlenségemre az adathalmazban csak 1998 óta vannak erre vonatkozó információk.

Néhány érdekes adat kiesett ebből a projektből, és remélem, hogy többeknek is érdekes adatokkal tudtam szolgálni. Talán még pár embert ahhoz is hozzásegítetek, hogy egy nagyobb összeget tudjon nyerni egy másfajta stratégiát választva!

Ha bármilyen hibát, javaslatot, ötletet vagy csak visszajelzést adnál, akkor kérlek jelezd hozzászólásként, vagy írj ide: leah [kukac] floppylab [pont] com

# adathalmaz: itt (2018. 01. 01.) és eredetileg innen (hetente frissítve)
# kapcsolat: leah [at] floppylab [dot] com

21 komment

kezdetnek... :)

2018. január 02. 02:23 - leahnora

Sziasztok!

Nem is olyan régen úgy döntöttem, hogy kitanulok data scientistnek, és hát nekivágtam. Ennek egyik első lépése volt az elemzés és vizualizáció fortályainak elsajátítása, és a dolog annyira megtetszett, hogy úgy gondoltam, hogy van elég érdekes adat felfedezésre várva, és nem csak a new yorki iskolák adatiból, vagy az elsüllyedt Titanic utasainak túlélési esélyeiről lehet jó elemzéseket, vizualizációkat csinálni, és ez megérhet akár egy blogot is. :)

Az adatok elemzését főként a Python nyelv és a Jupyter Notebook segítségével végzem. Az adatokat majd mindig felrakom egy jól elérhető helyre, hogy akit részletesebben is érdekel, az is hozzáférjen a megtisztított, összerakott adatokhoz. Ha pedig bárki csatlakozna a dologhoz, vagy akár csak egy-egy ötlettel hozzájárulna, az ne habozzon! 

utóirat: Nézzétek meg ezt a tök jó vizualizációt:

oscars-1024x630_1.png

 

Szólj hozzá!
süti beállítások módosítása