Aleksandr Timashov è un ML Engineer con oltre un decennio di esperienza in AI e Machine Learning. Ha conseguito una laurea in Matematica presso l’Università dell’Indiana e un certificato di specializzazione in Intelligenza Artificiale presso la Stanford University. La carriera di Aleksandr abbraccia diversi settori, tra cui e-commerce, petrolio e gas e fintech. In questa intervista, Aleksandr condivide le sue esperienze uniche di progetti pionieristici di Computer Vision e Data Science presso il gruppo energetico globale Petronas (Malesia).
Ciao Aleksandr. Racconta ai nostri lettori del tuo background e di come ti sei avvicinato alla Data Science e al Machine Learning?
La mia passione per la matematica è iniziata presto al liceo, quando ho partecipato alle olimpiadi a livello nazionale. Questo amore per i numeri e la risoluzione dei problemi è continuato all’università, dove sono stato attratto da materie come l’algebra lineare e la teoria della probabilità. Il passaggio al Machine Learning è stato naturale, data la mia formazione matematica. È un campo entusiasmante che mi consente di applicare concetti astratti per risolvere problemi del mondo reale.
Quando mi è stata offerta una posizione di Machine Learning presso Petronas, una grande azienda malese, l’ho vista come un’incredibile opportunità. La portata dell’azienda e il potenziale di avere un impatto significativo sono stati fattori importanti nella mia decisione. Lavorare presso Petronas non mi ha solo permesso di migliorare i processi aziendali, ma anche di influenzare positivamente la vita di milioni di malesi. È un ruolo che unisce le mie competenze tecniche a un impatto significativo e su larga scala.
Puoi raccontarci di Petronas, che tipo di azienda è? E cosa ti ha portato in Petronas, quali erano i tuoi obiettivi quando hai iniziato lì?
Petronas è una grande azienda statale in Malesia e, sebbene operi principalmente nel settore del petrolio e del gas, fa molto di più. Il gruppo di aziende Petronas include un mucchio di altre aziende associate a Kuala Lumpur e alla Malesia. Diciamo, ad esempio, che la holding immobiliare KLCC è direttamente collegata a Petronas. L’azienda è responsabile della sicurezza e della gestione delle torri gemelle del Kuala Lumpur City Center, le bellissime torri gemelle nella capitale della Malesia. E l’influenza dell’azienda non è limitata alla Malesia: è presente in più di 100 paesi in tutto il mondo.
Petronas è coinvolta in vari settori, dalla petrolchimica alla logistica ai servizi di ingegneria. L’azienda è anche famosa per aver aperto la strada a diversi campi della tecnologia digitale, tra cui Cybersecurity, IoT e, ciò che mi riguarda in modo specifico, Intelligenza artificiale.
I miei obiettivi principali nell’entrare in Petronas come professionista di Machine Learning e Data Science erano acquisire esperienza in un’azienda con grandi opportunità di miglioramento e condividere le mie conoscenze con quanti più giovani talenti possibile.
E hai raggiunto questi obiettivi?
Di sicuro, questo era un terreno fertile per le mie ambizioni! Quando sono entrato in azienda, stavano appena creando un grande dipartimento di Data Science/Machine Learning: a quel tempo, queste tecnologie non erano separate in azienda. Quando sono arrivato, c’erano già diverse decine di persone nel dipartimento, ma stavano ancora lavorando sulla roadmap strategica per il dipartimento. Allo stesso tempo, l’enorme vantaggio di questa situazione era rappresentato da molte opportunità di miglioramento e molte direzioni da seguire. Ho scelto Computer Vision come uno dei miei campi preferiti dell’IA. Per continuare su quel periodo, vi farò un esempio: un modello di Computer Vision che l’azienda stava utilizzando quando sono entrato poteva “pesare” un gigabyte. Il primo giorno, il giorno in cui ho iniziato a lavorare lì, ho creato al volo un modello che era 20 volte più piccolo e molto più accurato.
Il responsabile del dipartimento che ha lavorato con questo modello è rimasto sorpreso dalla rapidità e dalla precisione con cui il mio modello ha funzionato. Erano molto interessati e mi hanno chiesto se potevo ottimizzare il lavoro di altri modelli. Ho accettato a condizione che se avessi fatto qualcosa, ne fossi stato responsabile e mi fossero state fornite le risorse necessarie. E così ho avuto carta bianca per creare il team Computer Vision, per renderlo un’unità efficiente che avrebbe aiutato Petronas a raggiungere i suoi obiettivi. Le persone che ho formato sono ancora una parte fondamentale del team Computer Vision di Petronas.
Come hai affrontato la sfida di creare da zero un team di Computer Vision efficiente?
In realtà non si è trattato di una sola sfida, ma di diverse. A differenza delle aziende più piccole e delle startup, le grandi aziende con strutture e processi aziendali consolidati sono spesso restie a cambiare. Quando sono entrato, Petronas aveva già dei processi funzionanti e non era sempre ovvio come Computer Vision potesse contribuire a rendere quei processi ancora più efficienti. Quindi, da un lato, abbiamo dovuto convincere vari reparti all’interno dell’azienda ad accettare una nuova tecnologia e, dall’altro, far funzionare la tecnologia per loro.
E questo ci porta alla seconda sfida: creare un team che avrebbe implementato tutti questi cambiamenti. Il dipartimento era già operativo quando sono entrato, e non potevo iniziare gonfiando il personale: dovevo scegliere e formare persone che erano già lì. Ed ero emozionato di vedere quanto talento potessero avere le persone, anche se non avevano mai lavorato con la Computer Vision prima! Sono riuscito a trovare persone in azienda e nel dipartimento che erano interessate a cambiare il modo in cui venivano fatte le cose, persone che possiedono un pensiero critico e un amore per la risoluzione di complessi problemi matematici, e questo non è sempre un compito facile! Quindi, ci è voluto molto tempo e tutte le mie capacità comunicative, ma sono riuscito a far muovere le persone in azienda per farle diventare impregnate di Computer Vision.
Puoi raccontarci del tuo lavoro con Computer Vision presso Petronas?
Ho guidato diversi progetti che hanno fatto progredire notevolmente le capacità tecnologiche dell’azienda:
Analisi video in tempo reale per la sicurezza:
Abbiamo sviluppato un sistema avanzato che integra algoritmi di apprendimento profondo con l’infrastruttura CCTV esistente. Questo progetto ha superato le sfide nell’elaborazione di grandi quantità di dati visivi in tempo reale e nell’adattamento a varie condizioni ambientali. Il sistema risultante ha rilevato con precisione le minacce alla sicurezza, ottimizzando le operazioni di sicurezza e posizionando Petronas come leader nella sicurezza basata sull’intelligenza artificiale nel settore energetico della Malesia.
Ispezioni automatizzate di impianti industriali:
Abbiamo combinato la tecnologia dei droni con algoritmi avanzati di riconoscimento delle immagini per automatizzare le ispezioni degli impianti. Questo progetto senza precedenti in Malesia ha richiesto la creazione di modelli robusti per identificare difetti in diverse apparecchiature industriali in condizioni variabili. Abbiamo sviluppato una pipeline di dati personalizzata per gestire l’immenso volume di dati visivi, con conseguenti significativi risparmi sui costi e una ridotta esposizione umana ad ambienti pericolosi.
Digitalizzazione dei disegni tecnici:
Abbiamo affrontato la digitalizzazione dell’ampia collezione di disegni tecnici di Petronas utilizzando una combinazione di algoritmi di rilevamento OCR e di disegno. Una sfida fondamentale è stata la mappatura delle rilevazioni delle ispezioni tramite drone su mappe del mondo reale. Questo progetto ha migliorato notevolmente l’accessibilità e l’utilizzo di informazioni tecniche critiche, potenziando l’efficienza operativa e i processi decisionali.
In questi progetti, ho fatto da mentore a numerosi ingegneri ML, promuovendo una cultura di innovazione all’interno di Petronas. Il mio lavoro ha dimostrato una vasta competenza in computer vision, deep learning e IoT industriale, dimostrando la capacità di adattare tecnologie all’avanguardia alle esigenze specifiche del settore petrolifero e del gas e di affrontare sfide senza precedenti nel contesto malese.
Ci hai detto che stavi implementando questi progetti nel 2020-2022, quindi tutto è iniziato durante il periodo del Covid-19. La pandemia e l’isolamento hanno complicato il tuo lavoro?
Beh, ovviamente la pandemia ha influenzato le nostre operazioni, proprio come in tutto il mondo. In sostanza, le priorità stabilite prima del mio team sono cambiate e abbiamo iniziato a concentrarci su attività come la gestione della folla, il rilevamento delle mascherine, ecc. Vedete, come grande azienda statale, Petronas è responsabile di molti luoghi pubblici, tra cui il parco KLCC, ed è davvero bello che il nostro lavoro in quel momento abbia contribuito a salvare molte vite durante il COVID.
A proposito, non è stato solo il COVID a complicare il nostro lavoro e a renderlo più impegnativo e interessante. La Malesia è un paese prevalentemente musulmano, e questo significa che le persone potrebbero comportarsi in modo diverso e persino vestirsi in modo diverso rispetto alle persone nei paesi in cui la maggior parte dei modelli di ML e Computer Vision vengono solitamente formati. C’era un certo pregiudizio che abbiamo dovuto superare per far funzionare gli stessi modelli in un ambiente significativamente diverso.
Sembra davvero intrigante! Potresti raccontarci di più?
Ad esempio, i modelli pre-addestrati provengono principalmente dai paesi occidentali, dove non ci sono molte donne con copricapi che coprono la testa in vari gradi. È stato piuttosto problematico rilevare le donne che indossavano copricapi! Abbiamo dovuto riassemblare il set di dati, riaddestrare i modelli, ecc. Questo problema è unico per la Malesia.
E in secondo luogo, come ho già detto, c’è la cultura stessa. Le persone in Malesia sono meno propense a esprimere apertamente le proprie opinioni. A questo proposito, ho dovuto dimostrare ai miei compagni di squadra – di proposito – che potevo sbagliarmi anch’io. E quando gradualmente mi hanno fatto notare i miei errori, li ho incoraggiati. In questo modo un po’ indiretto, ho gradualmente costruito un ambiente più collaborativo, così familiare alle aziende occidentali, ma completamente nuovo per la Malesia.
In quanto persona che ha creato da zero un team che lavora all’avanguardia della tecnologia moderna, quale consiglio daresti agli aspiranti specialisti in Data Science e Machine Learning che desiderano avere un impatto significativo sulla propria carriera?
Per gli aspiranti specialisti in Data Science e Machine Learning, ho tre consigli fondamentali:
Valuta criticamente se questo campo è davvero in linea con le tue passioni. DS e ML sono complessi e altamente competitivi, e richiedono non solo abilità ma anche un autentico entusiasmo per avere successo.
Se sei certo che questa sia la tua strada, impegnati in un apprendimento intensivo e continuo. Come ha osservato Andrej Karpathy, ci vogliono circa 10.000 ore di lavoro dedicato per diventare un vero professionista in questo campo.
Concentrati sull’unirti alle migliori aziende o ai laboratori di ricerca dove puoi collaborare con menti di spicco del settore. Circondarti di colleghi brillanti accelererà la tua crescita in modo esponenziale. Sarai esposto a problemi all’avanguardia, soluzioni innovative e un livello di competenza che ti sfiderà e ispirerà ogni giorno.
Ricorda, se DS e ML sono davvero la tua passione, queste sfide saranno entusiasmanti. Questo entusiasmo, unito all’esposizione ai migliori talenti, sarà la chiave per avere un impatto significativo sulla tua carriera.
Quali sono le tendenze e i progressi attuali nel campo della visione artificiale che ritieni più entusiasmanti e promettenti?
Sebbene l’elaborazione del linguaggio naturale abbia visto notevoli progressi di recente, ritengo che la visione artificiale resti altamente sottovalutata e abbia un immenso potenziale inutilizzato. Siamo ancora lontani dal raggiungere capacità di livello umano nella percezione e nella comprensione visiva.
Una delle tendenze più promettenti nella Computer Vision è l’apprendimento auto-supervisionato. Questo approccio, che può essere paragonato al modo in cui i bambini imparano osservando il mondo che li circonda, ha mostrato un grande potenziale nel ridurre la necessità di grandi set di dati etichettati. Tuttavia, credo che manchi ancora un elemento cruciale nella replica completa dell’apprendimento e della comprensione visiva simili a quelli umani.
Sono particolarmente entusiasta dell’evoluzione dell’IA generativa in CV, in particolare dei modelli di diffusione e di coerenza. Queste tecnologie stanno rivoluzionando la generazione, la manipolazione e la comprensione delle immagini. I modelli di diffusione eccellono nella creazione di immagini diverse e di alta qualità, mentre i modelli di coerenza migliorano la nostra capacità di mantenere la coerenza tra diverse prospettive visive.
Nonostante questi progressi, siamo ancora nelle prime fasi di sblocco del pieno potenziale del CV. Il campo è maturo per l’innovazione, in particolare nello sviluppo di modelli più robusti e generalizzabili che possano avvicinarsi alla comprensione visiva a livello umano in contesti diversi. Ciò rende questo un momento incredibilmente entusiasmante per lavorare nella Computer Vision, con ampie opportunità per ricerche e applicazioni rivoluzionarie”.
Questa versione concisa mantiene i punti chiave sullo stato attuale del CV, la tua prospettiva sul suo potenziale e gli interessanti sviluppi nel settore, pur essendo più mirata e pertinente.
Credito per l’immagine in evidenza: rawpixel.com/Freepik