Il r1 di Rabbit perfeziona chat e timer, ma il suo 'modello di azione' basato sull'app è ancora MIA

Il r1 di Rabbit, il gadget assistente AI il cui entusiasmo si è un po' calmato dalla sua presentazione al CES, ha alcune novità da condividere - ma probabilmente nulla che cambierà presto l'opinione dei critici.

Una nuova modalità “beta rabbit” aggiunge alcune funzionalità di AI conversazionale al dispositivo, in particolare nelle istruzioni più complesse o a più fasi. Dovrebbe essere meglio nel fare domande di follow-up quando non è sicuro di qualcosa.

Come esempio, offrono qualcosa del genere:

“beta rabbit, puoi suggerire tre libri simili a ‘Il potere del momento’, includendo numero di pagine, anno di pubblicazione e valutazioni, e salvare tutto come nota dal titolo ‘lista di lettura’. includi anche le immagini degli autori”

[seguito da:] “beta rabbit, puoi anche farmi un riassunto di quei tre libri?”

Impostare un itinerario di viaggio e trovare offerte o raccomandazioni di prodotti sono alcune altre opzioni suggerite. Come utenti occasionali di chatbot, abbiamo trovato che questo tipo di compito è impressionante come demo, ma raramente utile nella realtà.

Per esempio, gli itinerari dei chatbot possono essere strani e imprevedibili, e confrontare specifiche e prezzi mostra abilità di web-scraping ma alla fine è scomodo su un dispositivo così piccolo. E chi si fiderebbe di raccomandazioni di libri così casualmente provenienti da fonti non affidabili?

Ci sono anche alcune migliorie per sveglie e timer (puoi vedere tutto il nuovo materiale qui), certamente gradite ma talvolta cadono nella categoria “un momento...”. Ad esempio, “imposta un timer per cuocere i biscotti al cioccolato” - a che temperatura? Quantità? Che tipo di biscotti? Questo è un ricetta per un disastro culinario. L'AI non può conoscere quelle informazioni. D'altra parte, sarebbe perfettamente ragionevole chiedere “quanto tempo dovrebbero cuocere nel forno due dozzine di biscotti al cioccolato a 300 gradi?”

Naturalmente, tutti stanno aspettando il tanto osannato ma finora altamente elusivo “grande modello di azione” di cui l'azienda vantava già a gennaio. La promessa - che all'epoca ho interpretato come ambiziosa ma non ridicola - era che il modello fosse addestrato su interfacce di app per telefoni e web, e sarebbe stato in grado di navigarle autonomamente per portare a termine compiti scelti dall'utente. Finora tale capacità non è stata mostrata al di fuori delle demo, o se un'azione è dichiarata di usarlo, è indistinguibile da ciò che potrebbe realizzare un'API o uno scripting di azione ordinario.

Rimango ottimista sull'utilità futura di questo simpatico piccolo dispositivo, ecco perché, anche se ho avuto quasi nessuna occasione di utilizzarlo da quando ne ho ricevuto uno da recensire, non l'ho ancora relegato in un cassetto.

Ho chiesto a rabbit quando possiamo aspettarci notizie sul LAM e aggiornerò questo post se ricevo una risposta.