Skip to content

Prima fase

Il primo step del progetto (anni 2020-2023) si è concluso con il raggiungimento di tre obiettivi.

Obiettivo 1. Creazione di una prima draft di Piattaforma Integrata e Federata nazionale, presso INFN (Piattaforma Cloud INFN-HBD).

Il Cloud INFN-HBD è un Community Cloud basato interamente su componenti open source, ispirato alla NIST Cloud Federation Reference Architecture (modello federato) e disegnato in modo da assicurare interoperabilità e portabilità del dato; capacità di calcolo, throughput di rete e storage; disponibilità di servizi e dati; protezione delle informazioni personali, conformità normativa (NIS, NIS2, GDPR) e multitenancy (ambienti virtuali isolati); sicurezza (confidenzialità, integrità, disponibilità e privacy: SGSI, ISO/IEC, ENISA); implementazione di modelli di governance e policy evoluti; reversibilità del data sharing. La federazione di Cloud è realizzata attraverso quattro sistemi chiave: autenticazione e autorizzazione; gestione dei dati; trasferimento dati; selezione automatica delle risorse sulla base delle policy di accesso, richieste e disponibilità di risorse.

Obiettivo 2. Migrazione nella Piattaforma Cloud Federata INFN-HBD dei dati retrospettivi generati dai Progetti delle Reti.

Il trasferimento nel Cloud di dati retrospettivi generati mediante specifici progetti di Rete (dati di proprietà delle Reti) ha rappresentato un primo livello di validazione della Piattaforma Cloud Federata INFN-HBD, relativamente alla tipologia dei dati ingeriti e alla federabilità di altre piattaforme di raccolta dati.
In particolare:
i) Rete ACC: è stata avviata con successo l’importazione di dati genomici e radiomici dei Progetti di Rete MELANOMA, ACC-Lung, e ACC Rationale, progetto ACC RECORD, PROGETTO GERSOM, per un totale di circa 6 TB di spazio.
ii) Rete RIN: sono stati predisposti le risorse (circa 30 TB) ed i protocolli per l’importazione di dati MRI dei progetti Redcap safe, XNAT- CLUSTER, RIN-Imaging, Neuro RIN e dati genomici relativi (ove disponibili).
iii) Rete Cardiologica: è iniziato con successo il processo di federazione con il Consorzio di Bioingegneria e Informatica Medica – CBIM, che gestisce  la piattaforma RedCap della Rete Cardiologica (Progetti VavirimS, Improve, SKIM, SPB, Outstanding, Fate, CophyTea, CardioCovid, Carditox, CV Prevital).

Obiettivo 3. Mappatura del livello di competenza nella gestione dei dati di ciascun IRCCS e condivisione di protocolli di estrazione/gestione del dato (interoperabilità).

Sono stati generati e condivisi con gli IRCCS partecipanti protocolli di estrazione/gestione di dati strutturati (omici, segnali e imaging) e non-strutturati (testi clinici; EMR; CTMS), modelli e policy per la gestione della privacy, sicurezza ed etica del dato; e alcune pipeline per analisi avanzate di dati clinici e di imaging. Ciò è stato ottenuto mediante l’attività di 7 Working Group (WG), ciascuno dedicato ad un tema specifico, composto da rappresentanti degli IRCCS e coordinato da esperti del Politecnico di Milano.
WG1. NLP (Natural Language Processing).
WG2. Dati omici, imaging e segnali.
WG3. Interazione tra cartelle cliniche elettroniche e sistemi per la gestione dei dati clinici ai fini della ricerca.
WG4. Identificazione degli strumenti metodologici e tecnologici necessari per l’estrazione e l’integrazione dei dati.
WG5. Architettura fisica del sistema.
WG6. Data Analysis.
WG7. Identificazione e implementazione di soluzioni relative a privacy e sicurezza, e altri problemi etici.

Seconda fase

Il secondo step del Progetto HBD (anni 2024-2026) sarà centrato su tre obiettivi principali.

Obiettivo 1. Validazione della Piattaforma Cloud Federata INFN-HBD.

Tale validazione è basata sulla generazione e condivisione di dati prospettici generati dagli IRCCS partecipanti. Verranno implementati alcuni progetti scientifici multi-centrici che coinvolgeranno gli IRCCS partecipanti attraverso le Reti di afferenza (Progetti Speciali), e che comporteranno: i) la generazione di dati clinico-scientifici presso gli IRCCS secondo i protocolli di trattamento dati stabiliti e validati nella prima fase; ii) la loro ingestione nella Piattaforma Cloud INFN-HBD; e iii) la loro condivisione da parte degli IRCCS afferenti.

Obiettivo 2. Estensione della Piattaforma Cloud INFN-HBD ad altri progetti di raccolta dati biomedici.

Durante lo scorso triennio sono stati stabiliti una serie di contatti finalizzati ad esplorare sinergie del Progetto HBD con altri Progetti di data-science biomedica, dai quali è emersa una visione di sistema ampiamente condivisa. Obiettivo del prossimo triennio è la formalizzazione di tali contatti al fine di identificare ed implementare specifici progetti e contesti istituzionali idonei per la federazione e messa a sistema delle iniziative di data-science biomedico più avanzate nel Paese, compresa la possibilità di usare INFN-HBD come il Cloud nazionale dei dati clinico-scientifici di ricerca.

Obiettivo 3. Sviluppo di algoritmi di analitica avanzata (intelligenza artificiale- AI) e creazione di una comunità di scienziati dedicati all’analisi di big data biomedici (Progetto HBD-AI).

Lo scopo ultimo del progetto HBD è quello di creare una risorsa universale di conoscenza in sanità, basata sul libero accesso di tutti i vari stakeholders a dati real-time di centinaia di migliaia di pazienti. L’uso dell’intelligenza artificiale rappresenta un approccio analitico potenzialmente trasformante. Critico per la piena realizzazione del potenziale dell’AI in sanità è lo sviluppo di algoritmi di AI più accurati e affidabili, la creazione di una comunità di data-scientists dedicati all’analisi di big-data biomedici, e la garanzia che AI sia utilizzata in modo sicuro ed equo.

Il ruolo centrale delle Reti

Le quattro Reti rivestono un ruolo centrale nel progetto HBD: ciascuna, in fase di start-up, ha infatti individuato un progetto di ricerca già attivo e lo ha condiviso sulla piattaforma.

Ciò ha consentito a HBD rapida operatività con patrimoni di dati esistenti ed eterogenei: omici, di pratica clinica, di imaging o, in previsione, direttamente raccolti dai pazienti e/o da sensori.

Attualmente le Reti hanno individuato e condiviso con HBD ulteriori linee di ricerca che hanno nella standardizzazione del dato e nella successiva condivisione, anche con gli IRCCS che partecipano a HBD, il denominatore comune.

ACC

ACC sta contribuendo allo sviluppo di HBD con vari progetti, di cui 6 caricati a sistema.

RIN

La Rete RIN ha differenti piattaforme su cui sono gestiti i dati degli studi di ricerca.

Rete Cardio

La Rete Cardio dispone già di un dataset condiviso per i singoli progetti di ricerca.

Rete IDEA

Rete IDEA contribuisce attivamente ad HBD con un importante progetto pilota.

Contattaci

Contact Us

Resta sempre aggiornato sulle novità del nostro sito.
Iscriviti alla nostra newsletter.