Digi Műhely | Adatok használata, védelme, elemzése
Mély megerősítéses tanulás
Készítette: Knoll Zsolt, Németh Marcell, Szűcs Gábor
A gépi tanulásnak három alapvető paradigmája van: felügyelt tanulás, felügyelet nélküli tanulás és megerősítéses tanulás. Megerősítéses tanulás esetén a gépi tanulási modellünket betesszük egy környezetbe, amelyben próbákon és hibákon keresztül a modell megtanulja hogyan maximalizálja a jutalmát az adott környezetben.
Az ezen témában elkészült tanulmány bemutatja a mesterséges intelligencia egy fontos ágát, a megerősítéses tanulást, a mélytanuláshoz használt neurális hálózatokat, az ezen területen használt módszereket, modelleket (DQN, DDQN), illetve a lehetséges pénzügyi alkalmazási területek.
A módszer működését egy részvényárfolyam előrejelzés példán keresztül mutatja be. A konkrét kérdés, hogy adott árfolyamértékek sorozatánál, idősornál hogyan lehet megjósolni a következő árfolyamértéket: értelemszerűen a múltbeli adatok felhasználásával, illetve új változók konstruálásával.
Felhasználható indikátorok/változók:
- egyszerű mozgóátlag
- exponenciális mozgóátlag
- árváltozás arány
- relatív erősség index
A „Mély megerősítéses tanulás ” című tanulmányhoz kapcsolódó workshop rövid összefoglalója:
A workshop az MNB munkatársainak lett meghirdetve, főleg informatikusoknak, de bárki eljöhetett. Az MNB munkatársai közül 3-an hallgatták meg és csinálták végig a Python tutorialokat. A neurális hálózatokon alapuló mély megerősítéses tanulásnak különböző módszerei, algoritmusai fontos alapköveket biztosítanak a mesterséges intelligencia területén, így ezek részletes bemutatása után az alkalmazási lehetőségekre mutattunk rá. A pénzügyi és gazdasági alkalmazások között bemutattuk az algoritmikus tőzsdei kereskedést (egy és több részvénnyel), majd begyakoroltattuk ezeknek a programozását Pythonban.
Kulcsszavak: gépi tanuló modellek; mélytanulás, megerősítéses tanulás, q-learning, algoritmikus tőzsdei kereskedés, mesterséges intelligencia