YOLO: l'algoritmo per chi osserva

Immagine di copertina

In un mondo pieno di algoritmi, quelli che gravitano intorno al mondo dell’intelligenza artificiale crescono in maniera esponenziale: uno degli ultimi arrivati è YOLO, e riguarda il campo dell’image recognition.

Cosa vedrai

Cosa vuol dire YOLO

YOLO (alias di You Only Look Once) è un sistema di rilevamento degli oggetti in tempo reale che identifica e classifica gli oggetti in un singolo passaggio dell’immagine. È un algoritmo di rilevamento degli oggetti a singolo stadio che unifica i componenti della pipeline di rilevamento degli oggetti in un’unica rete neurale.

Come funziona

YOLO divide un’immagine di input in una griglia e prevede simultaneamente più bounding box e probabilità di classe per ogni cella della griglia. Questa architettura unificata gli consente di elaborare le immagini in modo notevolmente veloce, rendendolo particolarmente adatto per applicazioni in tempo reale.

Credits to TowardsDataScience Blog

Un bounding box, in italiano “scatola delimitatrice”, è un rettangolo immaginario che circonda un oggetto all’interno di un’immagine. Questo rettangolo è definito da quattro coordinate che rappresentano i punti estremi dell’oggetto: le coordinate del punto in alto a sinistra (x_min, y_min) e le coordinate del punto in basso a destra (x_max, y_max). Il bounding box viene utilizzato nell’ambito del rilevamento degli oggetti per indicare la posizione approssimativa di un oggetto all’interno di un’immagine. Questo rettangolo fornisce un modo standardizzato per rappresentare la posizione e le dimensioni di un oggetto, facilitando il processo di identificazione e classificazione degli oggetti all’interno di un’immagine.

Esempio di bounding box con due Corgie adorabili

Vantaggi di YOLO per il rilevamento degli oggetti

  1. Elaborazione in tempo reale: YOLO è noto per la sua velocità, in grado di elaborare immagini a un alto ritmo, come 155 fotogrammi al secondo in YOLO v7, rendendolo ideale per applicazioni in tempo reale come la videosorveglianza e le auto a guida autonoma.

  2. Efficienza: L’architettura a singolo stadio di YOLO semplifica il processo di rilevamento degli oggetti, prevedendo bounding box e probabilità di classe in un singolo passaggio attraverso l’immagine, il che è efficiente ed efficace per vari compiti.

  3. Alta precisione: Nonostante la sua velocità, YOLO mantiene un’alta precisione nel rilevamento degli oggetti, raggiungendo risultati competitivi su benchmark come il dataset COCO, rendendolo una scelta affidabile per rilevamenti accurati.

  4. Adattabilità alle dimensioni degli oggetti: La flessibilità di YOLO nel rilevare oggetti di varie dimensioni e forme, grazie al suo approccio basato su griglia e anchor box, gli consente di gestire ambienti e oggetti diversi in modo efficace.

  5. Facilità di implementazione: La semplice architettura di YOLO e i requisiti minimi di dati di training lo rendono facile da implementare e adattare a nuovi compiti, riducendo la complessità della pipeline di rilevamento degli oggetti.

YOLO ha dimostrato di essere uno strumento prezioso per il rilevamento degli oggetti e ha aperto molte nuove possibilità per ricercatori e professionisti. Grazie alla sua combinazione di velocità, precisione, adattabilità ed efficienza, YOLO è una scelta ideale per chi cerca un algoritmo di rilevamento degli oggetti affidabile e performante.

Conosci meglio chi ha scritto questo articolo

Serena Sensini

Ciao! Mi chiamo Serena Sensini e sono la creatrice di @ TheRedCode.it. Ho aperto questo blog nel 2021 per raccontare il mio lavoro e il mondo dell’informatica a parole semplici, in piccole pillole e alla portata di tutte le persone.

Sono un’ingegnera informatica specializzata in ambito AI & NLP. Di giorno lavoro come CTO @ Welyk e come Innovation & Emerging Technologies Leader @ Dedalus, mentre di notte scrivo e sono autrice di 5 libri -per ora-. 🖊️

Foto di Serena Sensini

Partners

Community, aziende e persone che supportano attivamente il blog

Vuoi diventare tech content creator? 🖊️

Se ti va di raccontare la tua esperienza nel mondo tech, questo è il posto giusto.

Cerchiamo voci autentiche, esempi pratici e punti di vista utili per chi legge.

Scrivici a collaborazioni[at]theredcode.it con una proposta: idea, taglio del contenuto e una breve presentazione. Non vediamo l'ora di leggere la tua esperienza!

Invia la tua idea