Digi Műhely | Adatok használata, védelme, elemzése

Mély megerősítéses tanulás

Készítette: Knoll Zsolt, Németh Marcell, Szűcs Gábor

A gépi tanulásnak három alapvető paradigmája van: felügyelt tanulás, felügyelet nélküli tanulás és megerősítéses tanulás. Megerősítéses tanulás esetén a gépi tanulási modellünket betesszük egy környezetbe, amelyben próbákon és hibákon keresztül a modell megtanulja hogyan maximalizálja a jutalmát az adott környezetben.

Az ezen témában elkészült tanulmány bemutatja a mesterséges intelligencia egy fontos ágát, a megerősítéses tanulást, a mélytanuláshoz használt neurális hálózatokat, az ezen területen használt módszereket, modelleket (DQN, DDQN), illetve a lehetséges pénzügyi alkalmazási területek.

A módszer működését egy részvényárfolyam előrejelzés példán keresztül mutatja be. A konkrét kérdés, hogy adott árfolyamértékek sorozatánál, idősornál hogyan lehet megjósolni a következő árfolyamértéket: értelemszerűen a múltbeli adatok felhasználásával, illetve új változók konstruálásával.

Felhasználható indikátorok/változók:

  • egyszerű mozgóátlag
  • exponenciális mozgóátlag
  • árváltozás arány
  • relatív erősség index
A megerősítéses tanulás modellje, környezet-ágens

 

A „Mély megerősítéses tanulás ” című tanulmányhoz kapcsolódó workshop rövid összefoglalója:

A workshop az MNB munkatársainak lett meghirdetve, főleg informatikusoknak, de bárki eljöhetett. Az MNB munkatársai közül 3-an hallgatták meg és csinálták végig a Python tutorialokat. A neurális hálózatokon alapuló mély megerősítéses tanulásnak különböző módszerei, algoritmusai fontos alapköveket biztosítanak a mesterséges intelligencia területén, így ezek részletes bemutatása után az alkalmazási lehetőségekre mutattunk rá. A pénzügyi és gazdasági alkalmazások között bemutattuk az algoritmikus tőzsdei kereskedést (egy és több részvénnyel), majd begyakoroltattuk ezeknek a programozását Pythonban.

Kulcsszavak: gépi tanuló modellek; mélytanulás, megerősítéses tanulás, q-learning, algoritmikus tőzsdei kereskedés, mesterséges intelligencia