IA: perché la startup cinese DeepSeek ha messo in subbuglio il mondo tecnologico?

Effettua la tua ricerca

More results...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
Filter by Categories
#finsubito

Prestito condominio

per lavori di ristrutturazione

 


Pechino, 01 feb 13:58 – (Xinhua) – La comunità dell’intelligenza artificiale (IA) è in fermento per DeepSeek-R1, un nuovo modello open-source sviluppato dalla startup cinese DeepSeek.

Rilasciato il 20 gennaio, ha rapidamente scalato la classifica delle app gratuite sull’app Store di Apple, superando ChatGPT di OpenAI lunedì.

Secondo DeepSeek, in compiti come matematica, programmazione e ragionamento nel linguaggio naturale, le prestazioni di questo modello sono paragonabili a quelle dei principali modelli di giganti del settore come OpenAI, ma con una frazione del costo e della potenza computazionale richiesti dai concorrenti.

Cessione crediti fiscali

procedure celeri

 

Ecco cosa ha fatto DeepSeek e perché sta sorprendendo l’industria dell’IA.

COS’È DEEPSEEK?

Ufficialmente nota come DeepSeek Artificial Intelligence Fundamental Technology Research Co., Ltd., l’azienda è stata fondata nel luglio 2023. In quanto startup tecnologica innovativa, DeepSeek è dedicata allo sviluppo di avanzati modelli linguistici di grandi dimensioni (LLM) e tecnologie correlate.

Dal rilascio del suo primo modello, “DeepSeek LLM”, nel gennaio dello scorso anno, l’azienda ha attraversato molteplici cicli di iterazione. A dicembre, la startup ha lanciato il suo LLM open-source “V3”, che, secondo resoconti dei media statunitensi, ha superato tutti i modelli open-source di Meta e ha rivaleggiato con il modello chiuso GPT-4o di OpenAI.

Il modello appena rilasciato, R1, ha raggiunto un’importante svolta tecnologica: l’utilizzo di metodi di deep learning puro per consentire all’IA di sviluppare spontaneamente capacità di ragionamento.

A differenza degli approcci tradizionali come Chain-of-Thought (CoT) e Supervised Fine-Tuning (SFT), DeepSeek si è distinta nel settore dell’IA adottando il Reinforcement Learning (RL) come metodo di addestramento principale.

Mentre CoT e SFT si basano rispettivamente su un ragionamento a tappe e su enormi quantità di dati etichettati, RL permette ai modelli di apprendere attraverso meccanismi di interazione e ricompensa, rendendolo più adatto a compiti complessi e dinamici.

L’adozione del RL ha consentito a DeepSeek di migliorare il ragionamento, l’adattabilità e l’efficienza dei suoi modelli, distinguendola come leader nel settore.

Sconto crediti fiscali

Finanziamenti e contributi

 

Alla domanda sul significato di “DeepSeek”, il suo ultimo chatbot R1 ha risposto: “Il nome riflette la missione dell’azienda di esplorare in profondità e far progredire le tecnologie fondamentali dell’IA, con l’obiettivo di spingere i confini dell’innovazione e delle applicazioni dell’IA”.

“MAGGIORE GRANDEZZA NON SIGNIFICA PIU’ SEMPRE MAGGIORE INTELLIGENZA”

Secondo il rapporto tecnico del suo modello V3, il costo di produzione di DeepSeek è di circa 5,57 milioni di dollari, rendendolo il più economico tra gli LLM.

Il noto economista statunitense Jeffrey Sachs, professore e direttore del Center for Sustainable Development della Columbia University, ha dichiarato a Xinhua che il progresso compiuto da DeepSeek dimostra la possibilità di sviluppare IA avanzata con costi molto inferiori rispetto a quanto comunemente ritenuto negli Stati Uniti.

DeepSeek-V3 “lo fa sembrare facile oggi, con il rilascio open weights di un LLM di livello avanzato addestrato con un budget ridicolo (2.048 GPU per 2 mesi, 6 milioni di dollari)”, ha scritto su X Andrej Karpathy, membro fondatore di OpenAI.

Rispetto ad altri modelli noti, DeepSeek ha ottenuto una riduzione dei costi di un ordine di grandezza.

Il costo è “un netto contrasto con i centinaia di milioni, se non miliardi, che le aziende statunitensi tipicamente investono in tecnologie simili”, ha affermato Marc Andreessen, importante investitore tecnologico, descrivendo DeepSeek-R1 come “una delle innovazioni più sorprendenti” che abbia mai visto.

Microcredito

per le aziende

 

Lo sviluppo dell’industria dell’IA si è a lungo basato sull’aumento della potenza computazionale. Il modello DeepSeek, altamente efficiente nei costi, potrebbe rivoluzionare il panorama dell’IA.

Lodando il rapporto tecnico di DeepSeek-V3 come “molto ben fatto e dettagliato”, Karpathy ha affermato che vale la pena leggerlo attentamente.

La banca d’investimento e società di servizi finanziari statunitense Morgan Stanley ritiene che DeepSeek dimostri una via alternativa per l’addestramento efficiente dei modelli rispetto all’attuale corsa agli armamenti tra hyperscaler, puntando sull’aumento significativo della qualità dei dati e sul miglioramento dell’architettura dei modelli.

“Maggiore grandezza non significa più sempre maggiore intelligenza” ha dichiarato la società.

MODELLO OPEN-SOURCE

“Vedere il nuovo modello di DeepSeek è estremamente impressionante, sia per il modo in cui hanno realizzato efficacemente un modello open-source che esegue questo calcolo in fase di inferenza, sia per la sua straordinaria efficienza computazionale”, ha dichiarato Satya Nadella, AD di Microsoft.

Richiedi prestito online

Procedura celere

 

L’open-source consente a ricercatori, sviluppatori e utenti di accedere al codice sottostante del modello e ai suoi “pesi”, ovvero i parametri che determinano come il modello elabora le informazioni, permettendo loro di utilizzarlo, modificarlo o migliorarlo in base alle proprie esigenze.

DeepSeek ha tratto enormi vantaggi dai principi dell’open-source e, a sua volta, dimostra un forte impegno nella condivisione della conoscenza e nel contributo al progresso collettivo della tecnologia.

Yann LeCun, capo scienziato dell’IA presso Meta, ha affermato: “Hanno sviluppato nuove idee e le hanno realizzate basandosi sul lavoro di altri. Poiché il loro lavoro è pubblicato e open-source, tutti ne possono trarre beneficio.”

“Questo è il potere della ricerca aperta e dell’open-source,” ha aggiunto LeCun.

Facendo eco a LeCun, l’economista statunitense Jeffrey Sachs ha dichiarato: “Il modello di business e di sviluppo di DeepSeek è open-source, il che rappresenta un modello convincente e di successo per la scienza, la tecnologia e l’impresa”.

Mentre OpenAI inizialmente era nata come organizzazione open-source per poi passare a un modello chiuso, DeepSeek ha intrapreso una via diversa.

Evidenziando l’importanza di promuovere la collaborazione e l’innovazione attraverso i principi dell’open-source, Liang Wenfeng, fondatore di DeepSeek, ha dichiarato che la priorità è costruire un ecosistema tecnologico solido.

Mutuo 100% per acquisto in asta

assistenza e consulenza per acquisto immobili in asta

 

“Non sceglieremo il closed-source”, ha affermato Liang. (Xin)

© Xinhua



Source link

***** l’articolo pubblicato è ritenuto affidabile e di qualità*****

Visita il sito e gli articoli pubblicati cliccando sul seguente link

Source link

Conto e carta

difficile da pignorare