Automatisert dokumentforståelse med heuristikk og kunstig intelligens

Luca Labs AS | Bank og betalingstjenester

#Django

#Python

#RESTful API

#Google Cloud Platform (GCP)

#DocumentAI

I dette prosjektet utviklet vi en løsning for å automatisere behandlingen av kvitteringer og fakturaer for et regnskapsfirma. Målet var å forenkle og effektivisere den daglige håndteringen av innkommende dokumenter. Vi utviklet et Django-basert API for å håndtere forespørsler og videresende innkommende dokumenter til OCR-prosessoren. For å håndtere OCR-prosessen ble Google Document AI brukt for å gjøre om dokumentene til tekst. Deretter utviklet vi en rekke heuristiske modeller for å håndtere enkle forretningslogikker som kunne tolke dokumentfelter slik som totalbeløp og valuta. For å øke presisjonen og forbedre resultatene, utviklet vi flere maskinlæringsalgoritmer som skulle utvide tolkningen av dokumentene. Vi brukte en kombinasjon av Sci-kit learn og Tensorflow for å trene modellene på interne dokumenter selskapet hadde. Resultatene fra prosjektet viser at det er mulig å automatisere behandlingen av kvitteringer og fakturaer på en effektiv måte. Vi klarte å utvinne og tolke følgende dokumentfelter: organisasjonsnummer, valuta, beløp, fakturanummer, dokumentdato, forfallsdato, og leverandør.

  • Data Scientist

    Jan. 2021 - Jun. 2021

    Small thumbnail picture of Håkon Guttulsrud
  • Fullstack Developer

    Jan. 2021 - Jun. 2021

    Small thumbnail picture of Håkon Guttulsrud

Klar for å starte ditt neste prosjekt med oss?

Ønsker du et pristilbud? Eller ønsker du å bli kjent med oss over en kopp kaffe? Fyll inn din e-post, så tar vi kontakt med deg.


Vi bryr oss om beskyttelse av dine data.

Les mer om vår Personvernerklæring