Foto di Olya Kobruseva da Pexels

Machine Learning in una settimana

Intro

Entrare nel mondo del machine learning può sembrare un qualcosa di impossibile, soprattutto se inizi dalla fine.

 

Tuttavia, esistono moltissime risorse online totalmente gratuite che permettono di accelerare il percorso di formazione e di apprendere velocemente una serie di competenze di base.

 

Vediamo quindi come dedicarsi ad imparare il machine learning in una settimana e preparare il terreno per approfondire molto di più!

 

Piccolo disclaimer: conoscere Python e avere qualche nozione di matematica e statistica di base è sicuramente di grande aiuto.

 

Lunedì

 

Riferimenti:

Librerie da studiare:

  • Scikit-learn e pandas per la gestione dei dati;
  • Matplotlib per la visualizzazione dei dati;

 

La prima giornata dovrebbe concentrarsi nell’imparare in maniera generica che cos’è il machine learning e come gestire dati di diverse tipologie e che provengono da diverse fonti.

 

Durante il tuo percorso professionale infatti ti renderai conto che man mano che vai avanti, il recupero e la pulizia dei dati può richiedere molto più tempo rispetto all’effettivo tempo dedicato all’applicazione di meccanismi di apprendimento automatico.

 

In questo senso, la capacità di scrivere script per estrarre dati dai file o eseguire operazioni di web scraping sono spesso abilità essenziali per aspiranti professionisti dell’apprendimento automatico.

 

Martedì

Riferimenti:

Librerie da utilizzare:

  • Scikit-learn per la stima;
  • Matplotlib per mostrare un riepilogo dei dati iniziali;

 

Applicare quello che si impara al mondo reale è fondamentale. Quando si tocca con mano un problema reale, è più semplice memorizzare e analizzare quanto fatto, soprattutto se ci perdiamo diverso tempo.

 

Un modo per farlo può essere quello di utilizzare un dataset come quello riportato tra i riferimenti e porsi delle domande del tipo: “come posso stimare il voto finale dell’esame, sapendo il livello di istruzione dei genitori dello studente e il tipo di pranzo che hanno avuto?

 

Utilizzando le librerie messe a disposizione e scegliendo il giusto algoritmo, è possibile risolvere facilmente problemi come questi.

 

La consuetudine in questo tipo di attività è che i dati messi a disposizione vengano visualizzati per ottenere un quadro iniziale della situazione, per poi passare alla risoluzione effettiva.

 

Risolvere un problema come questo può sembrare piuttosto banale, ma posso assicurare che approcciarsi ad un argomento nuovo e toccare con mano i risultati prodotti dal lavoro è una forte spinta per la tua motivazione!

Mercoledì

Riferimenti:

 

Torniamo alla fase iniziale di apprendimento e iniziamo a comprendere le potenzialità di alcune attività, come la regressione e la classificazione. Utilizzando lo schema visto il giorno prima, concentriamoci su due problemi: cosa succede quando applichiamo un algoritmo? Cosa c’è dietro le quinte?

 

Passiamo quindi a studiare nel dettaglio cosa succede ai meccanismi di regressione, classificazione e clustering: capire cosa c’è sotto al cofano è fondamentale per applicare al meglio queste tecniche.

 

Non è necessario imparare a memoria l’algoritmo, ma è fondamentale comprenderlo: questo rende la fase di apprendimento effettiva, perché non si tratta più dell’applicazione meccanica di algoritmi, ma della risoluzione di problemi.

Giovedì

 

Riferimenti:

 

Tempo di mettersi alla prova: sul sito di Kaggle sono presenti moltissime competizioni che permettono di mettere alla prova le proprie capacità. Non tutte sono alla nostra portata per il momento, ma possiamo filtrare per beginners (o magari esplorare quelle già concluse) e avviarci verso un nuovo progetto.

 

Un esempio? Vediamo la competizione proposta per chi si approccia al mondo dell’intelligenza artificiale e vuole concentrarsi nell’ambito dell’analisi del linguaggio naturale: la challenge proposta non ha un dataset particolarmente grande ed è un’attività stimolante.

 

Il bello di questi progetti è il misurarsi con sé stessi: può essere estremamente frustrante passare le ore a studiare algoritmi e teoremi, per poi ritrovarsi davanti ad un problema reale senza alcuna certezza di dove iniziare con la risoluzione.

 

Venerdì

Riferimenti:

 

Il mondo del machine learning è davvero ampio, per cui può essere utile apprendere come utilizzare degli strumenti più “visuali”: un esempio è KNIME Analytics Platform, un programma open-source che permette di creare dei workflow per la scienza dei dati anche attraverso tecniche di machine learning disponibile per tutti i sistemi operativi.

 

Tip: se vuoi imparare nel dettaglio come usarlo, consiglio vivamente di leggere il libro Big Data Analytics di Andrea De Mauro, che porta molti esempi pratici di casi d’uso reali e di cui esiste una recensione qui!

 

Machine Learning in una settimana :S
Machine Learning in una settimana :S

 

Conclusioni

 

Farlo per una settimana non solo sarà molto divertente, ma può anche incrementare la tua consapevolezza dell’utilità e dell’importante riscontro nell’utilizzare queste tecniche nel mondo reale.

 

Alla fine di questa intensa settimana, dovresti essere in grado di saper svolgere qualche attività di base. Personalmente, posso dire che più ne imparo e più ci lavoro, più vedo quali e quante aree possono essere utilizzate per risolvere i problemi.

 

Il machine learning è un campo molto vasto e le professioni che richiedono queste competenze sono molte e diverse: se dopo questa settimana ti piace l’idea di fare di questa materia il tuo futuro lavoro, dai un’occhiata a questo articolo per cercare una specializzazione che ti stimoli!

Condividi la tua opinione