Questa settimana nell'IA: OpenAI guadagna un vantaggio infrastrutturale inestimabile

Salve, amici, benvenuti alla newsletter regolare sull'IA di TechCrunch. Se desiderate riceverla nella vostra casella di posta ogni mercoledì, iscrivetevi qui.

OpenAI sta facendo progressi a discapito dei suoi principali rivali.

Martedì, l'azienda ha annunciato il progetto Stargate, una nuova joint venture che coinvolge il conglomerato giapponese SoftBank, Oracle e altri per costruire infrastrutture per l'IA per OpenAI negli Stati Uniti. Stargate potrebbe attirare fino a $ 500 miliardi di finanziamenti per i data center per l'IA nei prossimi quattro anni, se tutto procede secondo i piani.

La notizia sicuramente ha dato fastidio ai concorrenti di OpenAI come Anthropic e xAI di Elon Musk, che non vedranno alcun enorme investimento infrastrutturale comparabile.

xAI intende espandere il suo data center a Memphis a 1 milione di GPU, mentre Anthropic ha recentemente siglato un accordo con Amazon Web Services (AWS), la divisione di cloud computing di Amazon, per utilizzare e perfezionare i chip personalizzati per l'IA dell'azienda. Ma è difficile immaginare che una qualsiasi delle aziende di IA possa competere con Stargate, anche nel caso di Anthropic, con le vaste risorse di Amazon.

Ammesso che Stargate non realizzi le sue promesse. Altri progetti di infrastrutture tecnologiche negli Stati Uniti non lo hanno fatto. Ricordate che nel 2017 il produttore taiwanese Foxconn si impegnò e successivamente fallì nel spendere $ 10 miliardi per una fabbrica vicino a Milwaukee.

Ma Stargate ha più sostenitori e momentum, da quanto sembra a questo punto. Il primo data center finanziato dall'iniziativa è già stato avviato ad Abilene, in Texas. E le aziende partecipanti a Stargate hanno promesso di investire $ 100 miliardi all'inizio.

In effetti, Stargate sembra pronto a consolidare l'incumbenza di OpenAI nel settore in espansione dell'IA. OpenAI ha più utenti attivi - 300 milioni settimanali - rispetto a qualsiasi altra impresa di IA. E ha più clienti. Oltre 1 milione di aziende pagano per i servizi di OpenAI.

OpenAI ha avuto il vantaggio del primo arrivato. Ora potrebbe avere la supremazia infrastrutturale. I rivali dovranno essere intelligenti se sperano di competere. La forza bruta non sarà un'opzione praticabile.

Notizie

Crediti immagine: Jakub Porzycki/NurPhoto / Getty Images

Esclusiva Microsoft non più: Microsoft era una volta il fornitore esclusivo di infrastrutture dei data center per OpenAI per addestrare ed eseguire i suoi modelli di IA. Non più. Ora l'azienda ha solo un "diritto di prelazione".

Perplexity lancia un'API: il motore di ricerca basato sull'IA Perplexity ha lanciato un servizio API chiamato Sonar, che consente a imprese e sviluppatori di integrare gli strumenti di ricerca generativi basati sull'IA della startup nelle proprie applicazioni.

L'IA accelera la "catena di eliminazione": Il mio collega Max ha intervistato il capo digital e AI officer del Pentagono, Radha Plumb. Plumb ha detto che il Dipartimento della Difesa sta utilizzando l'IA per ottenere un "vantaggio significativo" nell'identificare, rintracciare e valutare le minacce.

Controversie sui parametri di riferimento: Un'organizzazione che sviluppa parametri di riferimento matematici per l'IA non aveva dichiarato di aver ricevuto finanziamenti da OpenAI fino a relativamente di recente, attirando delle accuse di comportamento improprio da parte di alcuni nella comunità dell'IA.

Il nuovo modello di DeepSeek: Il laboratorio di IA cinese DeepSeek ha rilasciato una versione aperta di DeepSeek-R1, il suo cosiddetto modello di ragionamento, che afferma si comporta alla pari dell'o1 di OpenAI su determinati parametri di riferimento di IA.

Articolo di ricerca della settimana

Crediti immagine: Microsoft

La scorsa settimana, Microsoft ha messo in evidenza un paio di strumenti basati sull'IA, MatterGen e MatterSim, che afferma potrebbero aiutare a progettare materiali avanzati.

MatterGen prevede materiali potenziali con proprietà uniche, basate su principi scientifici. Come descritto in un articolo pubblicato sulla rivista Nature, MatterGen genera migliaia di candidati con "vincoli definiti dall'utente", proponendo nuovi materiali che soddisfano esigenze altamente specifiche.

Per quanto riguarda MatterSim, prevede quali dei materiali proposti da MatterGen sono stabili e realizzabili.

Microsoft afferma che un team presso l'Istituto di Tecnologia Avanzata di Shenzhen è riuscito a utilizzare MatterGen per sintetizzare un nuovo materiale. Il materiale non era perfetto. Ma Microsoft ha rilasciato il codice sorgente di MatterGen e l'azienda dice di avere intenzione di collaborare con altri collaboratori esterni per sviluppare ulteriormente la tecnologia.

Modello della settimana

Google ha rilasciato una nuova versione del suo modello sperimentale di "ragionamento", Gemini 2.0 Flash Thinking Experimental. L'azienda sostiene che si comporti meglio dell'originale su parametri di riferimento di ragionamento matematico, scientifico e multimodale.

I modelli di ragionamento come Gemini 2.0 Flash Thinking Experimental verificano efficacemente i fatti da soli, il che li aiuta ad evitare alcuni dei problemi che normalmente ostacolano i modelli. Di conseguenza, i modelli di ragionamento impiegano un po' più di tempo - di solito secondi o minuti in più - per arrivare a soluzioni rispetto a un tipico modello "non di ragionamento".

Il nuovo Gemini 2.0 Flash Thinking ha anche una finestra di contesto di 1 milione di token, il che significa che può analizzare documenti lunghi come studi di ricerca e documenti politici. Un milione di token corrisponde a circa 750.000 parole, o 10 libri di lunghezza media.

Assortimento

Crediti immagine: GameFactory

Un progetto di IA chiamato GameFactory dimostra che è possibile "generare" simulazioni interattive addestrando un modello su video di Minecraft e quindi estendendo quel modello a diversi domini.

I ricercatori dietro GameFactory, la maggior parte dei quali provengono dall'Università di Hong Kong e da Kuaishou, una società cinese parzialmente di proprietà statale, hanno pubblicato alcuni esempi delle simulazioni sul sito web del progetto. Lasciano a desiderare, ma il concetto è comunque interessante: un modello in grado di generare mondi in stili e temi senza fine.