Home > Webzine > Murate Idea Park: corso online di “Data Analytics con Apache Spark”
lunedì 23 novembre 2020

Murate Idea Park: corso online di “Data Analytics con Apache Spark”

23-06-2020
Murate Idea Park non si è mai fermato e organizza il nuovo corso online per sviluppatori “Data Analytics con Apache Spark”, in partenza a luglio, nel quale i partecipanti potranno approfondire la conoscenza di questo framework Open-Source attraverso l’aula virtuale, nella quale si avrà la possibilità di partecipare a laboratori, esercitazioni e prove pratiche finalizzate all’incremento delle competenze di sviluppo software.

Il corso si colloca nello scenario operativo per applicazioni e casi d’uso che lavorano sui Big Data. Apache Spark è un framework open-source per l’analisi di grandi quantità di dati su cluster e per il calcolo distribuito in memory che nasce da risultati di ricerca dei laboratori della University of California Berkeley, oggi rilasciato e mantenuto dall’ Apache Software Foundation.
L’attività formativa ha lo scopo di illustrare e far comprendere come funziona Spark internamente: i meccanismi, le logiche, l’utilizzo su cluster e lo sviluppo mediante APIs. Apache Spark gioca un ruolo importante nelle moderne applicazioni che hanno necessità di lavorare su grandi quantità di dati; infatti grazie alle sue prestazioni (flessibilità, modularità e integrazioni con altre tecnologie dell’ecosistema tecnologico) rappresenta, oggi, una delle tecnologie più innovative in ambito Big Data ed è usata dalle più importanti aziende del panorama IT. Apache Spark trova sempre più spazio all’interno di aziende di piccole e grandi dimensioni in svariati settori: delle analisi predittive, all’internet delle cose, passando per i sistemi di recommendation ed analisi di logs per la definizione di sistemi predittivi e descrittivi. Big tech powerhouses companies come Yahoo, eBay e Netflix utilizzano Spark su vasta scala, elaborando diversi petabyte di dati su cluster di oltre 8.000 nodi. Netflix, ad esempio, usa Spark come framework distribuito su cui basa uno dei più sofisticati e performanti algoritmi per generare, in tempo reale, consigli personalizzati. E’ facilmente utilizzabile nei linguaggi di programmazione Java, Scala e Python, e prevede anche un’integrazione con il linguaggio statistico R. La sua facilità d’uso ed il modello di astrazione dal calcolo distribuito su cluster ed “in memory” lo rende accessibile ad un vasto pubblico di sviluppatori, data engineer e data scientist.

Docente del corso è Gaetano Fabiano, big data software engineer presso diverse realtà aziendali, attualmente docente di Informatica, formatore, writer di articoli tecnici e freelance consultant in ambito di trasformazione digitale. Appassionato di innovazione, tecnologie e scienze nei settori dei Big Data, Data Science, Artificial Intelligence e Machine Learning.

Il corso si svolgerà online dal 1 al 14 luglio 2020.

Il costo del corso è pari a 100 euro + Iva.
Sono disponibili borse di studio offerte dalla Fondazione Ente Cassa di Risparmio per studenti ed inoccupati di età inferiore a 35 anni, a copertura totale o parziale del costo del corso.
Per i mentor MIP e per tutti i membri dei team vincitori attualmente del percorso MIP il corso è assolutamente gratuito.

Per maggiori informazioni: https://murateideapark.it/