Google sta sfruttando l’intelligenza artificiale generativa e più modelli di fondazione a introdurre Il ragionamento geospaziale, un’iniziativa di ricerca progettata per accelerare la risoluzione geospaziale dei problemi. Questo sforzo integra modelli linguistici di grandi dimensioni come Gemini e modelli di fondazioni di telerilevamento per migliorare l’analisi dei dati in vari settori.
Per anni, Google ha compilato dati geospaziali, che sono informazioni legate a specifiche posizioni geografiche, per migliorare i loro prodotti. Questi dati sono fondamentali per affrontare le sfide aziendali come quelle in materia di salute pubblica, sviluppo urbano e resilienza climatica.
I nuovi modelli di fondazioni di telerilevamento sono costruite su architetture come autoencoders mascherati, SIGLIP, Mammut e Owl-VIT e sono addestrati utilizzando immagini satellitari e aerei ad alta risoluzione con descrizioni di testo e annotazioni della scatola di delimitazione. Questi modelli generano incorporamenti dettagliati per immagini e oggetti e possono essere personalizzati per attività come la mappatura dell’infrastruttura, la valutazione dei danni alle catastrofi e la localizzazione di caratteristiche specifiche.
Questi modelli supportano le interfacce del linguaggio naturale, consente agli utenti di eseguire attività come trovare immagini di strutture specifiche o identificare strade impraticabili. Le valutazioni hanno dimostrato prestazioni all’avanguardia attraverso vari benchmark di telerilevamento.
Il ragionamento geospaziale mira a integrare i modelli di fondazione avanzata di Google con modelli e set di dati specifici dell’utente, basandosi sul pilota esistente di Gemelli capacità in Google Earth. Questo framework consente agli sviluppatori di costruire flussi di lavoro personalizzati su Google Cloud Platform per gestire complesse query geospaziali utilizzando Gemini, che orchestra l’analisi attraverso varie fonti di dati.
L’applicazione dimostrativa mostra come un gestore di crisi può usare il ragionamento geospaziale dopo un uragano da:
- Visualizzazione del contesto pre-disastro: Usando le immagini satellitari open source del Earth Engine.
- Visualizzazione della situazione post-disastro: Importazione di immagini aeree ad alta risoluzione.
- Identificazione delle aree danneggiate: Utilizzo di modelli di fondazioni di telerilevamento per analizzare le immagini aeree.
- Prevedere ulteriori rischi: Utilizzando le previsioni meteorologiche di Weathernext AI.
- Ponendo domande a Gemelli: Stima delle frazioni di danno, valore del danno alla proprietà e suggerire la priorità di soccorso.
L’applicazione dimostrativa include:
- Un’applicazione front-end Python confezionata: Ciò integra i componenti di mappatura e grafici con una finestra di chat.
- Un back-end agente: Ciò implementa un agente Langgraph distribuito utilizzando il motore dell’agente AI Vertex.
- Strumenti Accessibili LLM: Per accedere a Earth Engine, BigQuery, Google Maps Platform e Google Cloud Storage, eseguendo operazioni geospaziali e utilizzando endpoint di inferenza del modello di fondazione di telerilevamento distribuiti su Vertex AI.
L’applicazione utilizza immagini aeree ad alta risoluzione della Civil Air Patrol, pre-elaborata con AI di Bellwether, Moonshot di X per l’adattamento climatico, oltre agli edifici aperti di Google Research e ai modelli skai. Sono inoltre incorporati gli indici di vulnerabilità sociale, i dati sui prezzi delle abitazioni e le intuizioni di Google Weathernext.
Il coreografo di WPP integrerà PDFM con i suoi dati sulle prestazioni dei media per migliorare l’intelligence del pubblico basato sull’intelligenza artificiale. Airbus, Maxar e Planet Labs saranno i tester iniziali dei modelli di fondazione di telerilevamento.
In particolare:
- Airbus: I piani per utilizzare i modelli di fondazioni di telerilevamento di Google per consentire agli utenti di estrarre approfondimenti da miliardi di immagini satellitari.
- Maxar: Intende utilizzare i modelli per aiutare i clienti a interagire con il suo “globo vivente” ed estrarre le risposte mission-critical più velocemente.
- Planet Labs: Utilizzerà i modelli di fondazioni di telerilevamento per semplificare e accelerare le approfondimenti per i loro clienti.