Proletari del Machine Learning unitevi!

Reblogged from Scienza in Rete

Qualche giorno fa raccontavamo i dati di OCSE che mostrano che l’Italia è al quinto posto a livello mondiale per numero di articoli scientifici nell’ambito del Machine Learnig: davanti a noi solo Stati Uniti, Cina, Gran Bretagna e India.  Eppure – si diceva – se guardiamo le classifiche sul numero di brevetti siamo molto lontani dalla vetta. In quanti lavorano nel settore del ML, al di là dell’ambito accademico?

Su questo punto qualche settimana fa Kaggle, un’azienda che opera nell’ambito della Data Science, ha pubblicato i risultati di un sondaggio condotto in molti paesi del mondo, riguardante lo stato dell’arte della forza lavoro in questo settore. Un totale di oltre 16 mila persone coinvolte formate nell’ambito del ML fra attualmente occupati e non, oltre 200 delle quali in Italia.

In media, chi lavora nel Machine Learning ha circa 30 anni, ma questo valore varia da paese a paese. Per esempio, il rispondente medio dall’India era di circa 9 anni più giovane del rispondente medio dall’Australia. In Italia la mediana è di 34 anni nel complesso, e di 29 anni per le donne, sebbene queste ultime siano decisamente sottorappresentate in termini numerici: solo 29 su 238 rispondenti italiani era donna.
La percentuale più alta degli intervistati ha conseguito un master, che corrisponde alla nostra laurea specialistica, ma quelli con i salari più alti (cioè oltre 150.000 dollari annui) in media sono quelli che hanno anche conseguito un dottorato.

A definirsi ricercatore o scienziato, è solo una piccola fetta del campione: circa il 18% degli italiani, e il 13% del totale, ma a ben vedere essi rappresentano il terzo gruppo per tipo di lavoro. La maggioranza di chi lavora nel ML si definisce Data Scientist (un quinto del totale in Italia); ci sono poi gli sviluppatori (14%) e a seguire – appunto – gli scienziati (13%, a cui si aggiunge un 5% di persone che si definiscono ricercatori). A chiudere la classifica i vecchi programmatori (meno del 3% dei 16 mila intervistati) e i data miner, che sono pochissimi: l’1% nel complesso e lo 0,6% degli intervistati italiani.

Read More

Poca Intelligenza Artificiale in Italia

Reblogged from Scienza in Rete

Il Science, Technology and Industry Scoreboard 2017 di OCSE, che racconta il presente e il futuro della rivoluzione digitale, parla chiaro: le 5 parole chiave oggi sono Internet of Things, Mobile technologies, Cloud computing, Intelligenza artificiale e Big Data. Una carovana che avanza a ritmi serrati (basti pensare agli oltre 18 mila brevetti nell’ambito dell’intelligenza artificiale del 2015 contro i 700 dell’anno 2000) trainata dall’Oriente: Cina, Corea del Sud, Giappone, Taiwan e ovviamente gli Stati Uniti d’America.

Parlare di innovazione su questi temi chiave e di ricerca scientifica non significa però guardare nella stessa direzione, e l’Italia ne è un ottimo esempio: nonostante la nostra ottima posizione quanto a pubblicazioni di qualità, nel campo della innovazione tecnologica e del trasferimento tecnologico soprattutto su Big Data e Intelligenza Artificiale segniamo il passo.

Un esempio è dato dal comparto del Machine Learning, frontiera nell’universo dell’Intelligenza Artificiale. Secondo quanto riporta OCSE, l’Italia è al quinto posto a livello mondiale per numero di articoli scientifici sul tema: davanti a noi solo Stati Uniti, Cina, Gran Bretagna e India. Eppure, se guardiamo le classifiche sul numero di brevetti siamo molto lontani dalla vetta. In generale siamo al sesto posto al mondo per indice di citazioni, fatto che trova conferma nella massiccia presenza dell’Italia fra i vincitori di ERC Grants negli ultimi 10 anni.

Read More

È nata HealthDataJ. Curioso?

healthdataj logo

Cari amici,
vi segnalo che da oggi è attiva la comunità di HealthDataJ, un gruppo Facebook che nasce dall’esigenza (mia, anzitutto) di avere un luogo dove condividere i dati (database, rapporti, dossier,…) riguardanti l’ambito sanitario.

L’obiettivo di questo gruppo è costituire un archivio di risorse utili per chi si occupa o si interessa di salute e lo vuole fare “dati alla mano”. Ma penso possa essere anche un luogo per confrontarsi (educatamente) su questi dati.

HealthDataJ è anche una AudioNewsletter (un podcast insomma) che pubblicherò una volta al mese, dove segnalo i dati sanitari più interessanti pubblicati nel mese precedente, in Italia e fuori.

Ieri è uscita la prima newsletter, relativa a Gennaio 2018, dove si parla di morbillo, sorveglianza PASSI, celiachia, sopravvivenza per cancro, pensioni, antibiotico resistenza e molto altro. Poi per ogni puntata trovate sul mio sito l’elenco dei link che vengono segnalati, per andare direttamente ai dati.

[Disclaimer: Lo stile della newsletter non è pop, come va tanto di moda, semplicemente perché io non sono una persona pop, mi interessa che sia anzitutto utile. Perché non video? Banalmente perché mi piacciono di più i podcast, e io non sono tipo da video].

Spero vogliate partecipare numerosi al gruppo. In ogni caso vige la regola del Rasoio di Occam: «Entia non sunt multiplicanda praeter necessitatem», ovvero: postare poco e utile. Non inonderò ogni giorno la vostra bacheca, e vi chiedo di fare altrettanto.

Per tutte le info, visitate la pagina dedicata a HealthDataJ su questo sito!

Grazie!

Cristina

 

L’insostenibile leggerezza della giustizia artificiale

Reblogged from Scienza in Rete

Ogni giorno, i giudici sono chiamati a deliberare il futuro di un uomo e di una donna che ha commesso un reato sulla base del rischio che se rilasciato ne compia un altro. Questioni come “quanti anni dovremmo dare a una donna bipolare condannata per omicidio?”, “Dovremmo mandare in galera un giovane stupratore in attesa di processo e quindi innocente fino a sentenza, o rilasciarlo su cauzione con la possibilità che stupri altre donne se colpevole?”.

Forse non tutti sanno che le corti americane a partire dagli anni Ottanta, per assicurarsi che i giudici trattassero equamente tutti gli imputati, hanno iniziato a richiedere al personale delle prigioni di raccogliere dati sulle finanze degli imputati, sulle loro famiglie, sugli amici, su eventuali storie di droga e sui precedenti crimini, per provare a quantificare il rischio possibile di recidiva. Negli anni però da carta e penna si è passati ai computer. Da anni i tribunali americani fanno uso di sistemi algoritmici di Intelligenza Artificiale – per lo più tool privati – per profilare il livello di rischio di recidiva, valutando una serie di indicatori socio-economici. Uno studiopubblicato in questi giorni su Science suggerisce che questo ampio utilizzo di questi strumenti per valutare la possibilità di recidiva, non è migliore – per citare alla lettera – “di un gruppo di persone che possiedono solo alcune informazioni chiave”.

Già nel 2016 un’inchiesta di ProPublica, noto giornale investigativo americano, aveva evidenziato che il sistema denominato COMPAS (Correctional Offender Management Profiling for Alternative Sanctions) esprimeva fortissimi bias etnici: di fatto le persone afroamericane erano bollate come ad alto rischio di recidive molto di più rispetto ai bianchi. Proprio questa inchiesta ha dato il via allo studio ora pubblicato su Science condotto da Julia Dressel del Dipartimento di Computer Science del Dartmouth College, che si è posta la domanda più basilare: gli algoritmi riescono davvero a prevedere meglio della mente umana come andranno le cose, cioè in questo caso se la persona lasciata libera compirà un altro crimine una volta rilasciata oppure no?

Read More