LogicStar sta costruendo agenti AI per la manutenzione dell'applicazione

La startup svizzera LogicStar è determinata a entrare nel gioco degli agenti AI. La startup fondata nell'estate del 2024 ha ottenuto $3 milioni di finanziamenti pre-seed per portare strumenti sul mercato degli sviluppatori in grado di eseguire autonomamente la manutenzione delle applicazioni software, anziché il più tipico caso d'uso degli agenti AI di sviluppo del codice.

Il CEO e co-fondatore di LogicStar, Boris Paskalev, suggerisce che gli agenti AI della startup potrebbero finire per collaborare con agenti di sviluppo del codice, come ad esempio quelli di Cognition Labs (come Devin), in un vantaggio reciproco per le aziende.

La fedeltà del codice è un problema per gli agenti AI che costruiscono e distribuiscono software, così come lo è per gli sviluppatori umani, e LogicStar vuole fare la sua parte per agevolare il processo di sviluppo raccogliendo automaticamente e correggendo bug ovunque possano presentarsi nel codice distribuito.

A tal fine, stanno costruendo su grandi modelli linguistici (LLM) - come GPT di OpenAI o persino DeepSeek della Cina - adottando un approccio agnostico al modello per la loro piattaforma. Questo consente a LogicStar di attingere a diversi LLM e massimizzare l'utilità dei suoi agenti AI, in base al modello fondamentale che funziona meglio per risolvere un particolare problema di codice.

Paskalev sostiene che il team fondatore ha le conoscenze tecniche e specifiche del settore per costruire una piattaforma in grado di risolvere problemi di programmazione che possono sfidare o sorprendere i LLM che lavorano da soli. Hanno anche un precedente successo imprenditoriale a cui fare riferimento: ha venduto la sua precedente startup di revisione del codice, DeepCode, al gigante della cibersicurezza Snyk nel settembre 2020.

"All'inizio pensavamo di costruire effettivamente un grande modello linguistico per il codice", ha detto a TechCrunch. "Poi abbiamo capito che sarebbe diventato rapidamente una merce... Ora stiamo costruendo considerando tutti quei grandi modelli linguistici già esistenti. Supponendo che ci siano agenti AI decenti per il codice, come possiamo estrarre il massimo valore commerciale da loro?"

Ha detto che l'idea si basa sulla comprensione del team di come analizzare le applicazioni software. "Combine quello con i grandi modelli linguistici - quindi concentratevi su ciò che quei grandi modelli linguistici e gli agenti AI suggeriscono effettivamente."

Sviluppo guidato dai test

Cosa significa tutto ciò in pratica? Paskalev afferma che LogicStar esegue un'analisi di ogni applicazione su cui la sua tecnologia è implementata, utilizzando "metodi classici delle scienze informatiche", al fine di costruire una 'base di conoscenza'. Questo fornisce al suo agente AI una mappa completa degli input e degli output del software; come le variabili si collegano alle funzioni; e qualsiasi altro collegamento o dipendenza ecc.

Quindi, per ogni bug che gli viene presentato, l'agente AI è in grado di determinare quali parti dell'applicazione sono interessate - permettendo a LogicStar di individuare le funzioni che devono essere simulate per testare numerose correzioni potenziali.

Per Paskalev, questo 'ambiente di esecuzione minimizzato' consente all'agente AI di eseguire 'migliaia' di test mirati a riprodurre i bug per identificare un 'test fallito' e - attraverso questo approccio 'sviluppo guidato dai test' - alla fine arrivare a una correzione che funziona.

Conferma che le effettive correzioni dei bug sono provenienti dai LLM. Ma poiché la piattaforma di LogicStar consente a questo 'ambiente di esecuzione molto veloce' ai suoi agenti AI di lavorare su larga scala per separare il grano dalla pula, per così dire, e servire ai suoi utenti una scorciatoia verso il meglio che i LLM possono offrire.

"Quello che vediamo è che [i LLM] sono ottimi per il prototipare, testare cose, ecc., ma non sono affatto eccellenti per la produzione [di codice], applicazioni commerciali. Penso che siamo molto lontani da questo, ed è quello che offre la nostra piattaforma", ha sostenuto. "Per essere in grado di estrarre quelle capacità dei modelli oggi, possiamo effettivamente e in modo sicuro estrarre valore commerciale e risparmiare tempo agli sviluppatori per concentrarsi davvero sulle cose importanti."

Le imprese saranno il target iniziale di LogicStar. I suoi 'agenti di silicio' sono destinati ad essere messi al lavoro insieme ai team di sviluppo aziendali, pur necessitando di una frazione dello stipendio richiesto per assumere uno sviluppatore umano, occupandosi di una serie di compiti di mantenimento dell'app e liberando il talento ingegneristico per lavori più creativi e/o impegnativi. (O almeno, fino a quando i LLM e gli agenti AI diventano molto più capaci.)

Sebbene il pitch della startup enfatizzi una capacità di manutenzione dell'app 'completamente autonoma', Paskalev conferma che la piattaforma permetterà agli sviluppatori umani di revisionare (e altrimenti sovraintendere) le correzioni che i suoi agenti AI dispongono. Quindi la fiducia può essere - e deve essere - guadagnata prima.

"L'accuratezza che un programmatore umano offre varia tra l'80 e il 90%. Il nostro obiettivo [per i nostri agenti AI] è essere proprio lì", aggiunge.

È ancora presto per LogicStar: una versione alpha della sua tecnologia è in fase di test con diverse aziende non divulgate che Paskalev definisce 'partner di design'. Attualmente la tecnologia supporta solo Python - ma le espansioni verso Typescript, Javascript e Java sono considerate 'prossime in arrivo'.

"L'obiettivo principale [con i finanziamenti pre-seed] è dimostrare che la tecnologia funziona con i nostri partner di design - concentrandosi su Python", aggiunge Paskalev. "Abbiamo già trascorso un anno su questo e abbiamo molte opportunità per espanderci realmente. Ed è per questo che stiamo cercando di concentrarci prima, per mostrare il valore in un caso."

La raccolta pre-seed della startup è stata guidata dalla società di venture capital europea Northzone, con investitori angelo di DeepMind, Fleet, Sequoia scouts, Snyk e Spotify che si sono uniti al round.

In una dichiarazione, Michiel Kotting, partner di Northzone, ha dichiarato: "La generazione di codice guidata da AI è ancora ai suoi primi stadi, ma i guadagni di produttività che stiamo già osservando sono rivoluzionari. Il potenziale di questa tecnologia nel razionalizzare i processi di sviluppo, ridurre i costi e accelerare l'innovazione è immenso e l'ampia esperienza tecnica del team e il comprovato successo li posizionano per ottenere risultati reali ed efficaci. Il futuro dello sviluppo software sta cambiando forma e LogicStar avrà un ruolo cruciale nella manutenzione del software."

LogicStar sta gestendo una lista d'attesa per i potenziali clienti desiderosi di manifestare interesse per un accesso anticipato. Ci ha detto che è previsto un rilascio beta per la fine di quest'anno.