Openai ha introdotto Un nuovo strumento di intelligenza artificiale chiamato Deep Research che conduce una vasta ricerca online per gli utenti, affrontando compiti che vanno da complesse indagini scientifiche alle raccomandazioni personalizzate dei prodotti. Il servizio è disponibile per il pagamento dei clienti tramite Chatbot di Openai.
Cos’è una ricerca profonda?
Una ricerca profonda può generare rapporti completi in appena 5-30 minuti, un compito che in genere richiede agli utenti “molte ore”, secondo Openi. Lo strumento analizza una varietà di risorse, tra cui testo, immagini, PDF e file con caricamento utente, per sintetizzare le informazioni in modo simile a un analista di ricerca. Kevin Weil, Chief Product Officer di Openi, ha sottolineato la sua capacità di eseguire compiti complessi, confrontando le sue prestazioni con quella di un ricercatore umano.
Openi lancia O3-Mini, ancora più costoso di DeepSeek R1
Questo lancio segue l’introduzione da parte di Openai di un altro agente di intelligenza artificiale chiamato Operator, che assiste compiti come la prenotazione di voli e la gestione degli ordini della spesa. Entrambi i servizi sono disponibili esclusivamente per gli utenti sottoscritti al piano PRO CHATGPT da $ 200 al mese, indicando un focus strategico sui servizi di abbonamento a pagamento per finanziare queste funzionalità avanzate.
Modello | Accuratezza (%) |
---|---|
GPT-4O | 3.3 |
Grok-2 | 3.8 |
Sonetto Claude 3.5 | 4.3 |
Gemelli pensando | 6.2 |
Openai O1 | 9.1 |
DeepSeek-R1* | 9.4 |
OpenAI O3-Mini (Medium)* | 10.5 |
Openai o3-mini (alto)* | 13.0 |
Openai Deep Research ** | 26.6 |
Lo strumento esemplifica una tendenza più ampia nel settore dell’intelligenza artificiale verso lo sviluppo di agenti in grado di svolgere compiti a più fasi con una supervisione minima. I concorrenti, tra cui Microsoft Corp. e Antropic, stanno anche esplorando tecnologie simili nella speranza di migliorare la produttività attraverso compiti sia personali che professionali.
Il CEO di Openi Sam Altman ha indicato che lo sviluppo di tali agenti può rappresentare una svolta significativa nell’intelligenza artificiale. L’urgenza di questo progresso è sottolineata dall’aumento della concorrenza da parte di aziende di intelligenza artificiale cinesi come Deepseek, che stanno rapidamente avanzando nel settore.
Nonostante le sue capacità, Openi ha avvertito di potenziali limiti associati alla ricerca profonda. Lo strumento può produrre informazioni fabbricate e spesso confonde fonti credibili con voci. Gli utenti possono incontrare limiti, come l’incapacità di inviare più di 100 domande al mese durante il lancio iniziale.
Il lancio di ricerche profonde è stato dimostrato durante un evento a Washington, dove ha compilato con successo informazioni su Albert Einstein, compresa la generazione di domande rilevanti per ipotetici audizioni congressuali. Le relazioni prodotte da una ricerca profonda includono anche citazioni, sebbene le inesattezze possano derivare da un fenomeno noto come “allucinazione” nell’intelligenza artificiale.
Gaia | Livello 1 | Livello 2 | Livello 3 | Avg. |
---|---|---|---|---|
Sota precedente | 67.92 | 67.44 | 42.31 | 63.64 |
Ricerca profonda (pass@1) | 74.29 | 69.06 | 47.60 | 67.36 |
Research Deep (Contro@64) | 78.66 | 73.21 | 58.03 | 72.57 |
Openi prevede di ampliare l’accesso a una ricerca profonda in modo più ampio in futuro, rivolgersi agli utenti iscritti ai suoi piani plus, team e imprese. Lo strumento utilizza una versione dell’ultima tecnologia di ragionamento dell’azienda, Openai O3, che è specificamente ottimizzata per la navigazione Web e l’analisi dei dati.
La formazione di Deep Research ha incorporato compiti del mondo reale che richiedono capacità di navigazione e ragionamento. Impiega anche tecniche di apprendimento di rinforzo, migliorando la sua capacità di navigare e sintetizzare le informazioni efficacemente. Le recenti valutazioni hanno dimostrato che il modello sta raggiungendo una precisione senza precedenti in compiti di ricerca complessi.
Openai ha riferito che, in una valutazione chiamata ultima esame dell’umanità, il modello che alimentava la ricerca profonda ha ottenuto una precisione del 26,6%, un risultato notevole per i sistemi di intelligenza artificiale che affrontano domande a livello di esperti in materie diverse. Inoltre, sul benchmark pubblico di Gaia, lo strumento ha superato i precedenti record di prestazioni dimostrando capacità che richiedono ragionamento e fluidità multomodale.
Mentre lo strumento è attualmente molto ad alta intensità di calcolo, Openiai anticipa miglioramenti per renderlo più efficiente e intuitivo nel tempo, con piani per iterazioni future che potrebbero migliorare le sue caratteristiche e l’accessibilità.
Domenica sono state disponibili ricerche profonde per gli utenti di CHATGPT, con futuri miglioramenti che dovrebbero essere lanciati su piattaforme mobili e desktop. Openi prevede di espandere le funzionalità dello strumento per includere l’accesso a fonti di dati più specializzate, arricchindo così il contesto e la personalizzazione dei suoi output.
DeepSeek R1 vs O3-Mini in performance, costi e resa dei conti di usabilità
CHATGPT ne vale la pena fare una ricerca profonda?
Sì, se:
- Hai bisogno di ricerche veloci e complete: La ricerca profonda può generare rapporti dettagliati in 5-30 minuti, risparmiando ore di lavoro manuale. Se hai spesso bisogno di informazioni rapide e ben sintetizzate, questo strumento è un punto di svolta.
- Gestisci compiti complessi: Lo strumento è progettato per eseguire compiti in più fasi, rendendolo ideale per i professionisti che devono analizzare i dati, compilare report o condurre ricerche approfondite in vari settori.
- Sei un abbonato Chatgpt Pro: Se stai già pagando per il piano Pro Pro $ 200 al mese, avrai accesso a ricerche profonde e altre funzionalità avanzate come l’operatore, rendendolo una preziosa aggiunta al tuo kit di strumenti.
- Apprezzi la produttività guidata dall’IA: Se stai cercando di sfruttare l’intelligenza artificiale per migliorare la produttività in contesti personali e professionali, la ricerca profonda si allinea con la tendenza più ampia degli agenti di intelligenza artificiale che svolgono compiti complessi con una supervisione minima.
- Sei in un campo competitivo: Con i concorrenti come Microsoft e Antropic che sviluppano strumenti simili, stare davanti alla curva utilizzando strumenti di ricerca AI avanzati potrebbe darti un vantaggio.
No, se:
- Hai un budget limitato: A $ 200 al mese, il piano PRO CHATGPT è un investimento significativo. Se non hai bisogno di strumenti AI avanzati frequentemente, il costo potrebbe non giustificare i benefici.
- Sei preoccupato per la precisione: Una ricerca profonda ha limiti, tra cui il potenziale per produrre informazioni fabbricate o confondere fonti credibili con voci. Se il tuo lavoro richiede una precisione del 100%, questo strumento potrebbe non essere abbastanza affidabile.
- Superate i limiti di query: Durante l’implementazione iniziale, gli utenti sono limitati a 100 query al mese. Se le tue esigenze di ricerca superano questo limite, è possibile trovare lo strumento restrittivo.
- Preferisci la ricerca manuale: Se ti piace o hai bisogno di controllo pratico sul tuo processo di ricerca, fare affidamento su uno strumento AI potrebbe non allinearsi con il flusso di lavoro o le preferenze.
- Non hai bisogno di funzionalità avanzate: Se le tue esigenze di ricerca sono semplici o rare, le capacità avanzate della ricerca profonda potrebbero essere eccessive e potresti raggiungere i tuoi obiettivi con strumenti più basilari.
Credito immagine in primo piano: Aperto