Automatisert dokumentforståelse med heuristikk og kunstig intelligens
Luca Labs AS | Bank og betalingstjenester
#Django
#Python
#RESTful API
#Google Cloud Platform (GCP)
#DocumentAI
I dette prosjektet utviklet vi en løsning for å automatisere behandlingen av kvitteringer og fakturaer for et regnskapsfirma. Målet var å forenkle og effektivisere den daglige håndteringen av innkommende dokumenter. Vi utviklet et Django-basert API for å håndtere forespørsler og videresende innkommende dokumenter til OCR-prosessoren. For å håndtere OCR-prosessen ble Google Document AI brukt for å gjøre om dokumentene til tekst. Deretter utviklet vi en rekke heuristiske modeller for å håndtere enkle forretningslogikker som kunne tolke dokumentfelter slik som totalbeløp og valuta. For å øke presisjonen og forbedre resultatene, utviklet vi flere maskinlæringsalgoritmer som skulle utvide tolkningen av dokumentene. Vi brukte en kombinasjon av Sci-kit learn og Tensorflow for å trene modellene på interne dokumenter selskapet hadde. Resultatene fra prosjektet viser at det er mulig å automatisere behandlingen av kvitteringer og fakturaer på en effektiv måte. Vi klarte å utvinne og tolke følgende dokumentfelter: organisasjonsnummer, valuta, beløp, fakturanummer, dokumentdato, forfallsdato, og leverandør.