Case: Vahingonkorvauspäätös koneellisesti?
24.6.2019
Mitä ongelmaa ratkaistiin ja miksi?
- Tavoitteena oli kokeilla, kuinka koneoppimisalgoritmeja voitaisiin hyödyntää valtion vastuuseen perustuvien vahingonkorvausasioiden koneellisessa ratkaisussa.
- Valtion vastuuseen perustuvien vahingonkorvausasioiden kirjo on laaja ja yhteen asiaan liittyy paljon liitteitä. Osa liitteistä on vaikeasti koneluettavassa muodossa, esimerkiksi käsinkirjoitettuna.
Mitä tehtiin?
- Kokosimme yhteen koneluettavassa muodossa olevat pdf-lomakkeet ja yhdistimme ne aikaisemmin annettuihin vahingonkorvauspäätöksiin. Käsittelimme tekstiaineistot siten, että niitä voidaan käyttää koneoppimisalgoritmien sovittamiseen.
- Sovitimme aineistoon useita erilaisia koneoppimisalgoritmeja mm. random forest ja support-vector machine.
Tulokset
- Algoritmit kykenivät luokittelemaan oikein noin 70% testiaineiston tapauksista. Tarkkuus ei ole riittävä, mutta yllättävä kun otetaan huomioon aineiston laatu ja sen määrä (n. 300 havaintoa).
- Kokeilun ansiosta ilmeni, että vahingonkorvausasioiden liitteiden hallinnassa olisi automatisoinnin näkökulmasta kehitettävää.
- Koneoppimisalgoritmeissa on siis potentiaalia korvauspäätösten automatisointiin, kun datan laatuun ja määrään liittyvät ongelmat saadaan ratkaistua.