Nenos Software

Automatizarea Procesarii Documentelor Medicale

Automatizarea Procesarii Documentelor Medicale

Contextul si Provocarea  

Un operator major de asigurari medicale din Belgia procesa zilnic aproximativ 2.000 de documente medicale — formulare de rambursare, atestari de ingrijiri, prescriptii — primite prin multiple canale: fizic, scanat sau fotografiat cu dispozitive mobile. Documentele erau semi-structurate, continand combinatii de text tiparit, scriere de mana, coduri de bare, semnatura si stampile, cu variatii semnificative de calitate a imaginii.

Provocarea majora a proiectului a fost recunoasterea scrierii de mana a medicilor si practicienilor — un tip de continut notoric dificil pentru sistemele traditionale de recunoastere optica, din cauza stilurilor extrem de variate, a literelor legate, a prescurtarilor medicale si a calitatii slabe a scanarilor. Metodele clasice OCR/ICR esecuau frecvent pe acest tip de continut, generand date incorecte sau incomplete care necesitau verificare manuala sistematica.

Procesul manual de data entry genera erori frecvente, timpi lungi de procesare si costuri operationale ridicate, cu echipe dedicate exclusiv introducerii si validarii datelor. Operatorul avea nevoie de o solutie care sa elimine dependenta de munca manuala repetitiva fara a compromite acuratetea datelor extrase — o conditie critica intr-un mediu reglementat cum este cel al asigurarilor medicale.

Solutia

Nenos a proiectat si implementat o platforma document-centric cu arhitectura de tip workflow vizual, dezvoltata in React, care permite operatorului sa isi configureze propriile fluxuri de procesare prin intermediul unui editor grafic intuitiv. In nodurile fluxului sunt integrate module de deep learning antrenate pe sarcini specifice: imbunatatirea calitatii imaginii, clasificarea automata a tipului de document, recunoasterea textului tiparit si a scrierii de mana cu acuratete superioara metodelor traditionale OCR/ICR.

Modelele au fost antrenate exclusiv pe un corpus de 4 milioane de documente medicale belgiene, asigurand performanta optima pentru specificul formularisticii locale — structuri de campuri, abrevieri medicale, stiluri de scriere de mana ale medicilor si practicienilor. Infrastructura a fost deployata complet on-premises, in reteaua interna a operatorului, respectand cerintele stricte de confidentialitate si securitate a datelor medicale.

Human in the Loop si Imbunatatire Continua

Documentele pentru care nivelul de confidenta al modelului se situa sub pragul de acceptare — aproximativ 7% din volumul zilnic — erau redirectionate automat catre o coada de validare umana. Actiunile operatorilor in aceasta etapa erau capturate si reintroduse in ciclul de antrenare, imbunatatind continuu performanta modelelor fara interventia echipei tehnice.

Acest mecanism de feedback loop a transformat fiecare interactie umana intr-o oportunitate de invatare, crescand progresiv rata de procesare automata in timp si reducand treptat volumul documentelor care necesitau revizie manuala.

Rezultate 

Implementarea platformei a transformat fundamental operatiunile de procesare documentara ale clientului:

  • 93% din cele 2.000 de documente primite zilnic sunt procesate complet automat, fara interventie umana.
  • Timpul mediu de procesare pe flux este de aproximativ 2 minute per document.
  • Echipele de data entry au fost redirectionate catre activitati de valoare adaugata, reducand semnificativ costurile operationale.
  • Erorile de introducere manuala a datelor au fost eliminate, imbunatatind calitatea si consistenta datelor extrase.
  • Ciclul de rambursare pentru asigurati a fost accelerat, cu impact direct asupra experientei acestora.

Arhitectura Tehnica

Platforma este construita pe o arhitectura microservices, cu un frontend dezvoltat in React care expune editorul vizual de fluxuri — un environment de tip workflow in care fiecare nod reprezinta un modul functional independent: ingestie document, imbunatatire imagine, clasificare, recunoastere, validare, export date. Operatorul configureaza si modifica fluxurile de procesare fara cunostinte tehnice, prin interfata grafica, iar schimbarile sunt propagate in productie in timp real.

Nucleul de procesare este format din module de deep learning specializate, fiecare antrenat pe o sarcina specifica. Modulul de image enhancement utilizeaza retele neuronale convolutionale (CNN) pentru corectarea unghiului de scanare, eliminarea zgomotului, sharpening si indepartarea petelor — pregatind imaginea pentru etapele urmatoare indiferent de calitatea initiala a sursei. Modulul de clasificare automata identifica tipul documentului dintr-o taxonomie predefinita, folosind deep neural networks antrenate pe esantioane reprezentative din fiecare categorie. Modulul de recunoastere a caracterelor depaseste limitele OCR-ului traditional prin utilizarea de retele neuronale recurente (RNN) capabile sa interpreteze scriere de mana cursiva, sa coreleze date intre campuri multiple si sa aplice mecanisme de atentie pentru focalizarea pe zonele relevante ale documentului.

Toate modelele au fost antrenate pe un corpus de 4 milioane de documente medicale belgiene reale, ceea ce a asigurat robustete in fata variatiilor specifice domeniului — formulare locale, stiluri de scriere ale medicilor, coduri de nomenclatura si structuri de campuri specifice sistemului de sanatate belgian. Infrastructura este deployata complet on-

premises, in reteaua interna a operatorului, cu zero dependente externe la runtime. Mecanismul human-in-the-loop captureaza actiunile de corectie ale operatorilor si le reintroduce automat in ciclul de antrenare, intr-un feedback loop continuu care nu necesita interventia echipei tehnice.

Documente/zi
0
Timp mediu per document
0 min
Procesare automata
0 %