Strumenti di test per sistemi di intelligenza artificiale
Il ChatGPT ha scatenato un nuovo clamore sull'intelligenza artificiale, le cui possibilità sono impressionanti. Allo stesso tempo, la garanzia di qualità e il controllo dei sistemi di IA stanno diventando sempre più importanti, soprattutto quando questi assumono compiti di responsabilità. Perché i risultati dei chatbot si basano su enormi quantità di dati di testi provenienti da Internet. Nel processo, tuttavia, i sistemi come ChatGPT calcolano solo i più probabili [...]
Il ChatGPT ha scatenato un nuovo clamore sull'intelligenza artificiale, le cui possibilità sono impressionanti. Allo stesso tempo, la garanzia di qualità e il controllo dei sistemi di IA stanno diventando sempre più importanti, soprattutto quando questi assumono compiti di responsabilità. Questo perché i risultati dei chatbot si basano su enormi quantità di dati sui testi provenienti da Internet. Tuttavia, i sistemi come ChatGPT si limitano a calcolare la risposta più probabile a una domanda e a darla come dato di fatto. Ma quali strumenti di test esistono per misurare la qualità dei testi generati da ChatGPT, ad esempio?
Catalogo dei test KI
Strumenti di test in uso
I ricercatori del Fraunhofer IAIS presenteranno anche diversi strumenti e procedure di test presso lo stand congiunto del Fraunhofer nel padiglione 16, stand A12 della Hannover Messe 2023 dal 17 al 21 aprile, che possono essere utilizzati per esaminare sistematicamente i sistemi di IA alla ricerca di vulnerabilità durante il loro ciclo di vita e per proteggerli dai rischi dell'IA. Gli strumenti supportano gli sviluppatori e gli istituti di test nel valutare sistematicamente la qualità dei sistemi di IA, garantendone così l'affidabilità. Un esempio è lo strumento "ScrutinAI". Consente ai revisori di ricercare sistematicamente i punti deboli delle reti neurali e quindi di testare la qualità delle applicazioni di IA. Un esempio specifico è un'applicazione di IA che riconosce le anomalie e le malattie sulle immagini TAC. La questione è se tutti i tipi di anomalie vengono riconosciuti allo stesso modo o se alcuni sono migliori e altri peggiori. Questa analisi aiuta i tester a valutare se un'applicazione di IA è adatta al contesto di utilizzo previsto. Allo stesso tempo, anche gli sviluppatori possono trarre vantaggio riconoscendo le carenze dei loro sistemi di IA in una fase iniziale e adottando misure di miglioramento adeguate, come l'arricchimento dei dati di addestramento con esempi specifici.
Fonte e ulteriori informazioni: Fraunhofer IAIS
Questo articolo è apparso originariamente su m-q.ch - https://www.m-q.ch/de/prueftools-fuer-ki-systeme/