|
Résumé :
|
Le point sur une découverte récente concernant une faille de l'intelligence artificielle (IA) appelée le désalignement émergent : la notion d'alignement entre les objectifs des modèles et les valeurs humaines, la perte de cet alignement à la suite à une phase d'ajustement appelée "fine-tuning"et l'apparition de réponses malveillantes de la part de l'IA , le phénomène de désalignement émergent, la plus grande vulnérabilité des grands modèles d'IA à ce phénomène, les recherches actuelle visant à mieux comprendre le désalignement émergent afin de concevoir des IA plus sûres.
|