Reddit vuole essere pagato per aiutare a insegnare i grandi sistemi di intelligenza artificiale

Annuncio

Sostenuto da

Il sito Internet è da tempo un forum di discussione sui più svariati argomenti e aziende come Google e OpenAI lo utilizzano nei loro progetti di intelligenza artificiale.

Di Mike Isaac

Mike Isaac, con sede a San Francisco, scrive di social media e settore tecnologico.

Reddit è da tempo un punto caldo per le conversazioni su Internet. Circa 57 milioni di persone visitano il sito ogni giorno per parlare di argomenti diversi come trucco, videogiochi e suggerimenti per l'idrolavaggio dei vialetti.

Negli ultimi anni, la gamma di chat di Reddit è stata anche un aiuto didattico gratuito per aziende come Google, OpenAI e Microsoft. Queste aziende stanno utilizzando le conversazioni di Reddit per sviluppare giganteschi sistemi di intelligenza artificiale che molti nella Silicon Valley pensano siano sulla buona strada per diventare la prossima grande novità del settore tecnologico.

Ora Reddit vuole essere pagato per questo. La società ha dichiarato martedì che intende iniziare a far pagare alle aziende l'accesso alla sua interfaccia di programmazione dell'applicazione, o API, il metodo attraverso il quale entità esterne possono scaricare ed elaborare la vasta selezione di conversazioni da persona a persona del social network.

"Il corpus di dati di Reddit è davvero prezioso", ha affermato in un'intervista Steve Huffman, fondatore e amministratore delegato di Reddit. "Ma non abbiamo bisogno di dare tutto questo valore gratuitamente ad alcune delle più grandi aziende del mondo."

La mossa è uno dei primi esempi significativi di tariffazione da parte di un social network per l'accesso alle conversazioni che ospita allo scopo di sviluppare sistemi di intelligenza artificiale come ChatGPT, il popolare programma di OpenAI. Questi nuovi sistemi di intelligenza artificiale potrebbero un giorno portare alla nascita di grandi imprese, ma è improbabile che aiutino molto aziende come Reddit. In effetti, potrebbero essere utilizzati per creare concorrenti: duplicati automatizzati delle conversazioni di Reddit.

Anche Reddit si sta preparando per una possibile offerta pubblica iniziale a Wall Street quest'anno. L'azienda, fondata nel 2005, guadagna la maggior parte dei suoi guadagni attraverso la pubblicità e le transazioni di e-commerce sulla sua piattaforma. Reddit ha affermato che sta ancora definendo i dettagli su quanto verrà addebitato per l'accesso API e annuncerà i prezzi nelle prossime settimane.

I forum di conversazione di Reddit sono diventati beni preziosi poiché i modelli linguistici di grandi dimensioni, o LLM, sono diventati una parte essenziale della creazione di una nuova tecnologia AI.

Gli LLM sono essenzialmente algoritmi sofisticati sviluppati da aziende come Google e OpenAI, che è uno stretto partner di Microsoft. Per gli algoritmi, le conversazioni di Reddit sono dati e fanno parte del vasto pool di materiale immesso nei LLM per svilupparli.

L'algoritmo sottostante che ha contribuito a costruire Bard, il servizio di intelligenza artificiale conversazionale di Google, è in parte addestrato sui dati Reddit. La Chat GPT di OpenAI cita i dati Reddit come una delle fonti di informazioni su cui è stato formato.

Anche altre aziende stanno iniziando a vedere valore nelle conversazioni e nelle immagini che ospitano. Shutterstock, il servizio di hosting di immagini, ha anche venduto dati di immagine a OpenAI per contribuire a creare DALL-E, il programma di intelligenza artificiale che crea immagini grafiche vivide con solo un prompt basato su testo richiesto.

Il mese scorso, Elon Musk, il proprietario di Twitter, ha dichiarato che stava reprimendo l'uso dell'API di Twitter, che migliaia di aziende e sviluppatori indipendenti utilizzano per tracciare milioni di conversazioni attraverso la rete. Sebbene non abbia citato i LLM come motivo del cambiamento, le nuove commissioni potrebbero arrivare a decine o addirittura centinaia di migliaia di dollari.

Per continuare a migliorare i loro modelli, i produttori di intelligenza artificiale hanno bisogno di due cose importanti: un’enorme quantità di potenza di calcolo e un’enorme quantità di dati. Alcuni dei più grandi sviluppatori di intelligenza artificiale dispongono di molta potenza di calcolo, ma cercano comunque i dati necessari per migliorare i propri algoritmi al di fuori delle proprie reti. Ciò ha incluso fonti come Wikipedia, milioni di libri digitalizzati, articoli accademici e Reddit.

Notizia

Reddit vuole essere pagato per aiutare a insegnare i grandi sistemi di intelligenza artificiale