Michele Nasti

Thoughts on what I learn

Alla scoperta del Machine Learning

<a href="https://i2.wp.com/michelenasti.com/uploads/2016/02/machine-learning-e1454919682147.png" rel="attachment wp-att-582"><img class="size-full wp-image-582 aligncenter" src="https://i2.wp.com/michelenasti.com/uploads/2016/02/machine-learning-e1454919682147.png?fit=620%2C547" alt="machine learning" srcset="https://i2.wp.com/michelenasti.com/uploads/2016/02/machine-learning-e1454919682147.png?w=620 620w, https://i2.wp.com/michelenasti.com/uploads/2016/02/machine-learning-e1454919682147.png?resize=300%2C265 300w" sizes="(max-width: 620px) 100vw, 620px" data-recalc-dims="1" /></a>Ancora una volta non ho saputo resistere alla tentazione e ho iniziato lo studio di una tematica molto complessa: il Machine learning.

In realtà già ai tempi dell'Università abbiamo studiato qualcosa a riguardo, sebbene dal punto di vista estremamente statistico (e con R). La cosa incredibile è che questi sistemi, che 5 anni fa pensavo troppo futuristici, sono ovunque e da un bel po'. Pensate a Amazon quando vi propone un oggetto simile, a Google quando vi suggerisce una correzione (“forse cercavi...”), a LinkedIn che vi propone persone simili a voi.

Senza entrare nello specifico, attraverso il machine learning possiamo simulare una serie di comportamenti del nostro cervello:

  • prevedere un valore data una serie di valori simili (es. Il valore di una casa in base al valore di altre case)
  • analisi dei sentimenti (recensioni positive o negative)
  • deep learning (interpretare fotografie/oggetti complessi e il loro contenuto)
  • Sistemi di raccomandazione automatici (se ti piace questo, potrebbe piacerti anche...)
  • natural language processing

Ma non bisogna essere grandi nomi dell'IT per avere queste funzionalità. Né c'è bisogno di capire matematica avanzata o concetti di programmazione astrusi. Il Machine learning sta diventando accessibile a tutti grazie a una serie di librerie e con un po' di buona volontà. L'analisi dei Big Data sta diventando cruciale!

Resta da spiegare come sto affrontando lo studio di questi argomenti: da un punto di vista essenzialmente pratico, con Coursera, e tramite Python (sempre più il linguaggio di riferimento per il data science) e una libreria chiamata GraphLab. Esistono tutta una serie di funzioni già scritte che, preso un input, sono capaci di simulare i modelli statistici precedentemente descritti. Il corso in realtà dopo uno studio pratico diventa teorico, con la spiegazione degli algoritmi utilizzati e come funzionano.

Se volete studiarlo insieme a me, è il momento giusto. Ho appena completato la prima lezione e sto iniziando la seconda. Ci sono purtroppo delle scadenze per consegnare gli esercizi quindi... Partiamo!