
Il riconoscimento vocale viene integrato in quasi tutti gli aspetti della vita moderna, ma rimane un grande divario: gli speaker delle lingue minoritarie e coloro con accenti spessi o disturbi del linguaggio come la balbuzie sono generalmente meno in grado di utilizzare strumenti di riconoscimento vocale che controllano applicazioni, trascrivono o automatizzano compiti, tra le altre funzioni.
Tobi Olatunji, fondatore e CEO della startup di riconoscimento vocale clinico Intron Health, vuole colmare questo divario. Afferma che Intron è il più grande database di parlato clinico dell'Africa, con il suo algoritmo addestrato su 3,5 milioni di clip audio (16.000 ore) provenienti da oltre 18.000 contributori, principalmente operatori sanitari, provenienti da 29 paesi e con 288 accenti. Olatunji afferma che il coinvolgimento della maggior parte dei contributori provenienti dal settore sanitario garantisce che i termini medici siano pronunciati e catturati correttamente per i suoi mercati di riferimento.
“Poiché ci siamo già addestrati su molti accenti africani, è molto probabile che le prestazioni di base del loro accesso saranno molto migliori rispetto a qualsiasi altro servizio che utilizzano”, ha detto, aggiungendo che i dati provenienti dal Ghana, Uganda e Sudafrica stanno crescendo e che la startup è fiduciosa nel dispiegare il modello lì .
L'interesse di Olatunji per la tecnologia sanitaria deriva da due filoni della sua esperienza. In primo luogo, ha ricevuto un addestramento e ha praticato come medico in Nigeria, dove ha visto di persona le inefficienze dei sistemi di quel mercato, inclusa la quantità di documentazione che doveva essere compilata e quanto fosse difficile tener traccia di tutto.
“Quando ero medico in Nigeria alcuni anni fa, anche durante la scuola di medicina e anche ora, mi irritavo facilmente nel fare un compito ripetitivo che non meritava sforzi umani”, ha detto. “Un esempio semplice è che dovevamo scrivere il nome del paziente su ogni ordine di laboratorio che facevamo. E solo qualcosa di semplice, diciamo che sto visitando i pazienti e hanno bisogno di alcune prescrizioni, devono fare alcuni esami di laboratorio. Devo scrivere manualmente ogni ordine per loro. È frustrante per me dover ripetere il nome del paziente ripetutamente su ogni modulo, l'età, la data e tutto il resto. ... Mi chiedo sempre, come possiamo fare le cose meglio? Come possiamo rendere la vita più facile per i medici? Possiamo eliminare alcuni compiti e assegnarli a un altro sistema in modo che il medico possa dedicarsi a fare cose molto valide?”
Queste domande lo hanno spinto alla fase successiva della sua vita. Olatunji si è trasferito negli Stati Uniti per conseguire un master in informatizzazione medica presso l'Università di San Francisco e poi un altro in informatica presso la Georgia Tech.
Ha poi fatto pratica in diverse aziende tecnologiche. Come scienziato e ricercatore clinico della programmazione del linguaggio naturale (NLP) presso Enlitic, un'azienda della Bay Area di San Francisco, ha costruito modelli per automatizzare l'estrazione di informazioni dai rapporti testuali di radiologia. Ha anche lavorato per Amazon Web Services come scienziato dell'apprendimento automatico. In entrambi i casi, si è concentrato sul trattamento del linguaggio naturale per il settore sanitario, plasmando sistemi che consentono agli ospedali di funzionare meglio.
Durante quelle esperienze, ha iniziato a formulare idee su come ciò che veniva sviluppato e utilizzato negli Stati Uniti potesse essere utilizzato per migliorare l'assistenza sanitaria in Nigeria e in altri mercati emergenti simili.
Il progetto originario di Intron Health, lanciato nel 2020, era quello di digitalizzare le operazioni ospedaliere in Africa attraverso un sistema di cartella clinica elettronica (EMR). Ma l'accoglienza è stata difficile: si è scoperto che i medici preferivano scrivere piuttosto che digitare, ha detto Olatunji.
Questo lo ha portato a esplorare come migliorare quel problema più basilare: come rendere migliore il lavoro di inserimento dati essenziale per i medici. In un primo momento l'azienda ha esaminato soluzioni di terze parti per automatizzare compiti come la presa di appunti e incorporare tecnologie esistenti di riconoscimento vocale nel suo programma EMR.
Ci sono stati molti problemi, tuttavia, a causa di costanti errori di trascrizione. Olatunji ha capito chiaramente che gli accenti africani spessi e la pronuncia di termini medici e nomi complicati rendevano impraticabile l'adozione degli strumenti di trascrizione stranieri esistenti.
Questo segnò la nascita della tecnologia di riconoscimento vocale di Intron Health, che può riconoscere gli accenti africani e può essere integrata con gli attuali EMR. Finora lo strumento è stato adottato in 30 ospedali in cinque mercati, tra cui Kenya e Nigeria.
Vi sono stati alcuni risultati positivi immediati. In un caso, ha detto Olatunji, Intron Health ha contribuito a ridurre il tempo di attesa per i risultati di radiologia presso uno dei più grandi ospedali dell'Africa Occidentale da 48 ore a 20 minuti. Tali efficienze sono fondamentali nell'erogazione dell'assistenza sanitaria, specialmente in Africa, dove il rapporto tra medico e paziente rimane uno dei più bassi al mondo.
“Gli ospedali hanno già speso così tanto per attrezzature e tecnologia ... Assicurarsi che applichino queste tecnologie è importante. Siamo in grado di fornire valore per aiutarli a migliorare l'adozione del sistema EMR”, ha detto.
Riguardo al futuro, la startup sta esplorando nuovi fronti di crescita supportata da un round di finanziamento iniziale di 1,6 milioni di dollari, guidato da Microtraction, con la partecipazione di Plug and Play Ventures, Jaza Rift Ventures, Octopus Ventures, Africa Health Ventures, OpenseedVC, Pi Campus, Alumni Angel, BakerBridge Capital e diversi investitori angelo.
Per quanto riguarda la tecnologia, Intron Health sta lavorando per perfezionare l'annullamento del rumore, nonché per garantire che la piattaforma funzioni bene anche a bassa larghezza di banda. Ciò si aggiunge alla possibilità di abilitare la trascrizione di conversazioni a più altoparlanti e integrare capacità di sintesi vocale in testo.
Il piano, dice Olatunji, è quello di aggiungere sistemi intelligenti o strumenti di supporto decisionale per compiti come la prescrizione di farmaci o esami di laboratorio. Questi strumenti, aggiunge, possono aiutare a ridurre gli errori medici, garantire una cura adeguata ai pazienti e velocizzare il loro lavoro.
Intron Health è tra il crescente numero di startup di IA generative nel settore medico, tra cui il DAX Express di Microsoft, che stanno riducendo i compiti amministrativi per i clinici generando note in pochi secondi. L'emergere e l'adozione di queste tecnologie avvengono mentre il mercato globale del riconoscimento vocale è proiettato a raggiungere un valore di 84,97 miliardi di dollari entro il 2032, seguendo un tasso di crescita annuo composto del 23,7% dal 2024, secondo Fortune Business Insights.
Oltre a costruire tecnologie vocali, Intron sta anche svolgendo un ruolo fondamentale nella ricerca del linguaggio parlato in Africa, essendosi recentemente associato a Google Research, alla Bill & Melinda Gates Foundation e a Digital Square presso PATH per valutare i modelli di linguaggio large language models (LLMs) popolari come il GPT-4o di OpenAI, il Gemini di Google e il Claude di Anthropic in 15 paesi, per identificare punti di forza, debolezze e rischi di bias o danni nei LLMs. Tutto ciò al fine di garantire che siano disponibili modelli culturalmente attenti per le cliniche e gli ospedali africani.