Détection d'Anomalies dans un Flux de Données Spectrales
Objectif de la thèse
- Étudier les caractéristiques des données spectrales.
- Étudier et proposer des mesures de similarité appropriées pour les flux de données spectrales.
- Proposer un algorithme interprétable de détection d'anomalies dans les flux de données spectrales.
Description du projet
Les techniques de mesure de la qualité du vide sont diverses et varient en complexité selon l'objectif. Dans ce contexte, et avec l'objectif plus spécifique de surveiller la propreté du vide, la spectrométrie d'émission optique (OES) et la spectrométrie de masse quadripolaire (QMS) apparaissent comme des solutions de référence, notamment pour l'identification en temps réel et le suivi de la composition des gaz.
L'OES est largement déployée sur les équipements de production en microélectronique qui nécessitent l'utilisation d'un plasma pour des procédés tels que la gravure sèche. Elle est utilisée pour le suivi qualitatif des gaz injectés pendant les étapes actives dans la chambre de procédé et consiste à utiliser un spectromètre optique pour décomposer en longueurs d'onde la lumière émise par le plasma.
En parallèle, pour des contrôles plus quantitatifs et ou plus sensibles par rapport à l'OES, le spectromètre de masse quadripolaire est notamment utilisé sur les équipements de dépôt physique en phase vapeur, où la propreté du vide est essentielle. Dans cette application, une mesure plus quantitative est généralement possible. Le gaz à l'intérieur de l'enceinte sous vide mesurée est alors décomposé selon le rapport masse sur charge.
Ces technologies ont en commun de fournir un spectre en temps réel, optique ou de masse, composé de centaines voire de milliers de points de données, et c'est principalement à partir de ce constat que le cœur de ce travail de thèse est envisagé.
La pertinence de l'analyse réalisée avec les spectromètres de masse quadripolaires ou les capteurs OES repose sur la capacité non seulement à détecter des événements inattendus parmi un grand volume de données, mais aussi à comprendre les spectres générés. Ce processus nécessite encore aujourd'hui un effort applicatif important réalisé par des experts.
L'objectif de cette thèse CIFRE est de développer une recherche innovante sur la détection automatisée de la contamination. Dans un premier temps, il sera nécessaire d'étudier le fonctionnement de chacune des technologies visées, notamment en lien avec l'usage attendu, afin d'en maîtriser les principes de fonctionnement et les limites. En parallèle, il s'agira de concevoir, d'implémenter et de caractériser des solutions algorithmiques pour exploiter les données spectrales, non seulement pour détecter des situations anormales dans la composition du vide, mais aussi pour expliquer les raisons de ces déviations.
Ressources & liens
- Code : GitHub repository
- Jeux de données : Télécharger via UCA Drive
- Article OnlineBootKNN : Voir sur AAAI
- Version HAL de OnlineBootKNN : Voir sur HAL Science