Le simulazioni Molecular Dynamics (MD) sono una pietra miliare della chimica e della biologia moderna, ma automatizzarle è rimasta una sfida, fino a quando ora.
I ricercatori dell’Università di Rochester e Futurehouse Inc., tra cui Quintina Campbell, Sam Cox, Jorge Medina, Brittany Watterson e Andrew D. White, hanno introdotto MDCrow: Automatizzazione dei flussi di lavoro della dinamica molecolare con grandi modelli di lingua Strutturare le attività MD complesse utilizzando modelli di linguaggio di grandi dimensioni (LLM).
Mdcrow si integra 40 strumenti progettati da esperti Per gestire ogni fase di un flusso di lavoro MD, dalla preparazione di file di input all’esecuzione di simulazioni e all’analisi dei risultati. A differenza dei precedenti tentativi limitati a specifici ecosistemi software, MDCrow è progettato per un’ampia adattabilità. Impiega ragionamento a catena Per interagire con gli strumenti dinamicamente, ottimizzare i flussi di lavoro senza richiedere un vasto intervento umano.
La sfida di automatizzare le simulazioni MD
Le simulazioni MD richiedono Meticolosa messa a punto dei parametridalla selezione dei campi di forza alla gestione di passaggi pre e post-elaborazione complessi. Mentre i progressi computazionali hanno migliorato l’accessibilità, L’automazione completa è rimasta sfuggente a causa del processo decisionale altamente specializzato coinvolto. Precedenti sforzi, come Radonpy e Pyautofep, si sono concentrati su domini ristretti o integrazioni rigide richieste. Mdcrow cambia questo da Combinando l’adattabilità degli LLM con strumenti MD specializzaticreazione di un sistema in grado di generalizzare attraverso diverse applicazioni scientifiche.
Come funziona Mdcrow
Costruito usando il Framework di Langchain e un prompt in stile reactMdcrow funziona come un Assistente guidato da LLM che seleziona ed esegue autonomamente le azioni all’interno di un ambiente controllato. Interagisce con gli strumenti in quattro aree chiave:
- Recupero delle informazioni: Accesso alla letteratura, ai database e alle strutture proteiche per informare i parametri di simulazione.
- PDB e gestione delle proteine: Pulizia e elaborazione di file PDB per simulazioni molecolari.
- Esecuzione della simulazione: Esecuzione di simulazioni MD utilizzando OpenMM, gestione automatica degli errori.
- Analisi e visualizzazione: Generazione di approfondimenti da output di simulazione, comprese le analisi strutturali e le valutazioni di stabilità.
L’innovazione chiave è la capacità di Mdcrow Adatta dinamicamente alla complessità delle attività. Che si tratti di eseguire una semplice pulizia della struttura o di orchestrare simulazioni a più fasi con analisi complesse, il sistema perfeziona il suo approccio in base ai risultati passati e al feedback in tempo reale.
Benchmarking mdcrow
Per valutare le capacità di Mdcrow, il team di ricerca lo ha testato 25 compiti di crescente complessitàconfrontando le sue prestazioni tra diversi LLM, incluso GPT-4O, LLAMA3-405B e Opus Claude-3.
I risultati sono sorprendenti:
- MDCrow, alimentato da GPT-4O, ha completato con successo il 72% delle attivitàSetup LLM standard di distanza di distanza.
- Llama3-405B, un’alternativa open source, ha raggiunto il 68% di completamentodimostrando una soluzione non propostabile.
- LLM di base senza strumenti specializzati di MDCrow hanno raggiunto solo il 28% di precisioneevidenziando l’importanza di flussi di lavoro progettati da esperti.
- Lo stile rapido ha avuto un impatto limitato su modelli ad alte prestazioni ma ha influenzato significativamente quelli più deboli, rafforzando la necessità di ragionamenti strutturati in compiti scientifici complessi.
Mdcrow rappresenta a Grande passo verso simulazioni molecolari completamente autonomema il suo impatto si estende oltre i flussi di lavoro MD. Di consentendo all’intelligenza artificiale di gestire compiti computazionali complessi e in più fasiMdcrow dimostra come gli LLM possono servire come Assistenti scientificiAccelerare la scoperta attraverso la chimica, la scienza dei materiali e la bioingegneria.
Lo studio mostra anche l’importanza di Collaborazione umana-AI. Mentre MDCrow automatizza i processi di routine, la sua funzione interattiva di “chat” consente agli scienziati di perfezionare i flussi di lavoro in tempo realeguidare l’IA verso la risoluzione dei problemi più complessa.
La ricerca è open-source, con codice disponibile su Github.
Credito immagine in primo piano: Kerem Gülen/Midjourney