Data Scientist – Engineer – Architect… si fa presto a dire lavoro con i Dati!

Pubblicato il Pubblicato in Big Data, Business Intelligence
data scientist

Come cambiano le professioni digitali: differenza tra un Data Scientist ed un Data Engineer

Saper analizzare ed interpretare i dati è un mestiere antico la cui disciplina – la statistica – ha una storia lunga centinaia di anni. Come ogni altra scienza nasce come attività pratica, tesa alla soluzione di problemi concreti, per poi evolvere dal punto di vista teorico e metodologico. Concretamente si è sempre basata sulla raccolta e sull’analisi delle informazioni relative ai fenomeni da studiare, eppure negli ultimi anni sono avvenuti cambiamenti tali da ridefinire radicalmente ruoli e professioni che gravitano attorno a tale disciplina.

La scienza dei dati è ormai un’industria fiorente: paesi e aziende in tutto il mondo continuano a sviluppare nuovi strumenti e tecnologie talmente innovative da impattare ogni contesto sociale, culturale, economico e anche politico. Cresce conseguentemente la richiesta di esperti che possano lavorare sui dati.

Tali esperti hanno ormai molti nomi, ciascuno afferente un ruolo diverso. Il più popolare è il Data Scientist (Scienziato del dato). Esiste poi il Data Engineer (Ingegnere dei dati), il Data Architect (Architetto di dati), etc etc. Ma quanti di noi hanno chiara la differenza tra tutti questi ruoli?

data scientistChi lavora nel campo sa che c’è molta confusione in merito. C’è anche chi finisce per credere che tutte queste persone facciano lo stesso lavoro e che solo i loro nomi siano diversi. Non è affatto così! Facciamo un pò di chiarezza e analizziamo oggi le differenze tra un Data Scientist ed un Data Engineer, elencandone le tipiche responsabilità, le skills richieste e le tecnologie tipicamente utilizzate.

Data Scientist

Utilizza le proprie capacità analitiche e tecniche per estrarre informazioni significative dai dati.

Responsabilità

  • Sviluppare e pianificare il progetto analitico richiesto in risposta alle esigenze aziendali;

·         Contribuire alle architetture di data mining, agli standard di modellazione ed alle metodologie di analisi dei dati;·         Collaborare con gli stakeholder per integrare i risultati di data mining con il sistema esistente;

  • Monitorare le prestazioni del sistema di data mining e implementarne l’efficienza.

Skills

  • Programmazione, Matematica, Comprensione del business aziendale, Statistica, Data visualization, Machine Learning.

Tecnologie tipicamente utilizzate

  • R, Tableau, Spark, Matlab, Python, QlikView

 

Data Engineer

Assicura un flusso ininterrotto di dati tra server e applicazioni. Sono responsabili dell’architettura dei dati.

Responsabilità

  • Progettare, costruire, installare, testare e mantenere un sistema di gestione dei dati scalabile ad alta velocità;
  • Migliorare le procedure, le linee guida e gli standard fondamentali dei dati;
  • Integrare le nuove tecnologie di gestione dei dati nelle strutture esistenti;

Skills

  • Progettazione database, raccolta dati, data warehousing, trasformazione dati (ETL, vedi articolo Pentaho), lavorare in modo scrupoloso con i dati.

Tecnologie tipicamente utilizzate

  • Oracle, MySql, Spark, Mongo DB, SAP, Pentaho, Cassandra, Map Reduce, Pig, Hadoop

…vi lascio con una citazione 😉

 “Tortura abbastanza a lungo i dati ed essi confesseranno qualunque cosa.” (Ronald Harry Coase)


Vuoi scoprire tutte le nostre offerte di lavoro? visita la sezione Jobs del sito di Proxima Informatica


Segui sempre il nostro Blog e tieniti informato!

CondividiShare on FacebookEmail this to someoneShare on LinkedIn
 

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *