Ultima edizione | Archivio giornali | Archivio tematico | Archivio video
Mensile a cura dell’Ufficio Stampa del Consiglio Nazionale delle Ricerche
Archivio
N. 10 - 1 giu 2011
ISSN 2037-4801
Focus - Matematica
Il termine data mining nasce nei primi anni '80 in ambito informatico per identificare le tecniche finalizzate all'estrazione di conoscenza dall'immensa quantità di dati correlati che i moderni sistemi di archiviazione digitale permettono di gestire.
"Le tecnologie di data mining", afferma il presidente del Consiglio nazionale delle ricerche Luciano Maiani, "rappresentano una frontiera promettente e strategica per il futuro della ricerca nel campo dell'Ict. Trasformare il diluvio di dati in leva strategica per la crescita sociale ed economica e riuscire ad estrarre nuova conoscenza dalle informazioni, per renderle utilizzabili, rappresentano sfide su cui si sta misurando tutta la comunità scientifica internazionale. In Italia il Cnr costituisce il maggiore gruppo di studio in questo settore, con sette laboratori, oltre 60 ricercatori e ben 4.250.000 euro l'anno di fondi da progetti esterni".
"L'Istituto di analisi dei sistemi e informatica (Iasi) del Cnr è una delle strutture di ricerca maggiormente coinvolte", spiega Giovanni Felici dello Iasi-Cnr. "Le applicazioni per le tecniche di data mining sono infinite: dal migliorare le previsioni di fenomeni come le condizioni atmosferiche allo studio delle grandezze economiche; dalla lotta alle frodi all'intelligence; dalla genetica alla ricerca per ridurre il costo dello sviluppo dei farmaci. In particolare noi ci occupiamo di alcune applicazioni bioinformatiche, studiando gli algoritmi per la predizione precoce del morbo di Alzheimer e per l'identificazione con elevata precisione della specie di un campione biologico da un piccolo frammento del Dna. Sebbene possa sembrare un problema esclusivamente sperimentale, l'analisi del Dna, che si presenta come una lunga sequenza di combinazioni di quattro diverse molecole (i nucleotidi o basi), richiede programmi di calcolo complessi, capaci di scovare una piccola sottosequenza all'interno di sequenze molto più ampie. La grande quantità di dati ottenuta da progetti come quello sul genoma umano è infatti di difficile utilizzo senza gli algoritmi della bioinformatica".
Un altro dei campi applicativi di maggiore interesse economico e più attuali di questa branca dell'analisi statistico-matematica è quello del 'profiling', che mira a caratterizzare le persone sulla base dei loro acquisti, delle telefonate, dei siti internet visitati, degli articoli on line letti, al fine di tracciarne la personalità per scopi commerciali e pubblicitari. Per questa ragione è necessario che lo sviluppo di tali tecniche proceda di pari passo con quello di strumenti tecnologici, giuridici ed economici in grado di garantirne un uso corretto e lecito.
A questo scopo il Cnr e la Fondazione Ugo Bordoni hanno siglato un accordo quadro di collaborazione scientifica. "L'intesa nasce dalla volontà di valorizzare i patrimoni di conoscenza comuni per lo sviluppo di questo settore strategico e abilitante", spiega Riccardo Pietrabissa, direttore del dipartimento Tecnologie dell'informazione e della comunicazione (Ict) del Cnr, "nella consapevolezza che la ricerca sia uno degli strumenti centrali per lo sviluppo sociale, economico e industriale del Paese".
Claudio Barchesi
Fonte: Giovanni Felici, Istituto di analisi dei sistemi ed informatica "Antonio Ruberti", Roma, tel. 06/7716443 , email giovanni.felici@iasi.cnr.it -