Garanzia di qualità dell'IA: verifica e validazione all'avanguardia

In tutto il mondo è in corso la formulazione di norme giuridiche per l'intelligenza artificiale (IA) e gli ingegneri che sviluppano sistemi abilitati all'IA devono conformarsi a queste specifiche e standard di nuova introduzione. La Commissione europea ha presentato la prima proposta di quadro giuridico per la regolamentazione dell'IA nell'aprile 2021. I sistemi di IA dovevano essere valutati e regolamentati in modo diverso a seconda del loro rischio per gli utenti. Nel maggio 2024, gli Stati membri dell'UE hanno infine adottato la legge sull'IA, la prima normativa completa sull'IA a livello mondiale.

Il processo di sviluppo a forma di W è un flusso di lavoro V&V non lineare che garantisce l'accuratezza e l'affidabilità dei modelli di intelligenza artificiale. (Immagine: The MathWorks, Inc.)

Queste norme e regolamenti hanno un impatto significativo sui sistemi critici per la sicurezza con componenti di IA in particolare. Le tecniche di V&V (verifica e validazione) sono utilizzate per garantire che l'output di un modello di IA soddisfi i requisiti e le specifiche. La verifica controlla se un modello di IA è stato creato e sviluppato in conformità ai requisiti specificati. La convalida verifica se il prodotto soddisfa i requisiti e le aspettative del cliente. I metodi di V&V consentono anche di individuare tempestivamente i bug e le strategie per gestire i dati distorti (data bias).

Christoph Stockhammer, Senior Application Engineer di MathWorks, spiega come gli ingegneri possono impostare tali processi di V&V e i vantaggi che essi apportano allo sviluppo di modelli di intelligenza artificiale nei sistemi critici per la sicurezza.

Verifica e convalida: Perché i sistemi di intelligenza artificiale ne traggono vantaggio

Un vantaggio dell'uso dell'intelligenza artificiale nei sistemi critici per la sicurezza è che i modelli di intelligenza artificiale possono approssimare i sistemi fisici e convalidare la progettazione. Gli ingegneri simulano i sistemi con componenti di IA e utilizzano i dati per testare il comportamento in diversi scenari, compresi gli eventi anomali. L'esecuzione di V&V garantisce che un sistema di sicurezza critico supportato dall'intelligenza artificiale possa mantenere il livello di prestazioni e funzionalità richiesto in diverse condizioni.

La maggior parte dei settori in cui vengono sviluppati prodotti con componenti di intelligenza artificiale richiede ai propri ingegneri la conformità agli standard di sicurezza prima che i prodotti vengano lanciati sul mercato. Tra questi, l'industria automobilistica e dei veicoli, nonché l'industria aeronautica, aerospaziale e della difesa. I processi di certificazione vengono utilizzati per garantire l'integrazione di determinati elementi in questi prodotti. Gli ingegneri utilizzano il V&V per testare la funzionalità di questi elementi, il che rende più facile o addirittura possibile l'ottenimento delle certificazioni.

Dalla pianificazione alla pratica: gli elementi costitutivi dei processi V+V

Quando si esegue la V&V, gli ingegneri devono garantire che il componente di IA soddisfi i requisiti specificati, rimanga affidabile in tutte le condizioni operative e sia sicuro e quindi pronto per l'uso. Il processo di V&V per l'IA prevede l'esecuzione di attività di garanzia del software. Queste consistono in una combinazione di analisi statiche e dinamiche, test, metodi formali e monitoraggio operativo nell'uso reale. I processi di V&V possono variare leggermente a seconda del settore, ma includono sempre le stesse fasi generali:

  • Analizzare il processo decisionale per risolvere il problema della scatola nera: Il problema della scatola nera si presenta quando gli ingegneri non riescono a capire come un modello di intelligenza artificiale prenda le decisioni. L'analisi dell'importanza delle caratteristiche valuta quali variabili di input (ad esempio, fattori ambientali in sistemi critici per la sicurezza) hanno la maggiore influenza sui valori di output del modello di IA. Le tecniche di spiegabilità aiutano a comprendere la logica decisionale di un modello, ad esempio identificando le aree delle immagini che contribuiscono maggiormente all'output del modello. Entrambi gli approcci promuovono la trasparenza e la fiducia di ingegneri e scienziati nei sistemi di IA.
  • Testare il modello utilizzando set di dati rappresentativi: Gli ingegneri testano i modelli di intelligenza artificiale con set di dati rappresentativi per identificare i limiti e aumentare l'affidabilità del modello. I dati vengono puliti e vengono sviluppati casi di test per valutare aspetti quali l'accuratezza e la riproducibilità. Infine, il modello viene applicato ai set di dati, i risultati vengono registrati e confrontati con l'output previsto. Il progetto del modello viene migliorato in base ai risultati dei test sui dati.
  • Esecuzione di simulazioni del sistema di intelligenza artificiale: Le simulazioni consentono agli ingegneri di valutare le prestazioni di un sistema di intelligenza artificiale in un ambiente virtuale controllato. Strumenti come Simulink® aiutano ad analizzare il comportamento del sistema in base a diversi scenari, parametri e fattori ambientali. Come per i test sui dati, i risultati della simulazione vengono confrontati con i risultati previsti o noti e il modello viene migliorato iterativamente.
  • Assicurare il funzionamento del modello entro limiti accettabili: Per far funzionare i modelli di intelligenza artificiale in modo sicuro e affidabile, è necessario definire dei valori limite e monitorarne il comportamento. Uno dei problemi più comuni con i limiti si verifica quando un modello è stato addestrato con un set di dati specifico e riceve in ingresso dati che non rientrano nella distribuzione di questo set di dati. I modelli vengono addestrati con l'aumento dei dati (ad esempio, la variabilità dovuta alle diverse prospettive delle immagini) e il bilanciamento dei dati (distribuzione uniforme delle classi di dati) per ridurre le distorsioni e aumentare la capacità di generalizzazione. Per rendere le reti neurali più robuste e meno inclini all'errore di classificazione, è possibile integrare modelli matematici rigorosi nel processo di sviluppo e validazione per dimostrare alcune proprietà desiderabili delle reti neurali.

Queste fasi del processo di V&V sono iterative e consentono di perfezionare e migliorare continuamente il sistema di IA, man mano che gli ingegneri raccolgono nuovi dati, acquisiscono nuove conoscenze e integrano il feedback delle operazioni.

Conclusione: la V&V come chiave per un'implementazione responsabile dell'IA

Nell'era dei sistemi critici di sicurezza alimentati dall'intelligenza artificiale, le procedure di V&V svolgono un ruolo cruciale nell'ottenimento delle certificazioni di settore e nel rispetto delle normative di legge. La costruzione e il mantenimento di sistemi affidabili richiede l'uso di tecniche di verifica che forniscano spiegazioni e trasparenza per i modelli di IA su cui girano questi sistemi. Ciò garantisce un uso trasparente e responsabile dell'IA nei sistemi critici per la sicurezza.

Autore

Christoph Stockhammer - Ingegnere applicativo senior presso MathWorks

Fonte: www.mathworks.com

Questo articolo è apparso originariamente su m-q.ch - https://www.m-q.ch/de/ki-qualitaetssicherung-verifikation-und-validierung-am-puls-der-zeit/

Altri articoli sull'argomento