Plan de cours
Durée : 3 jours |
© AFI Expertise inc. | |
Dans chaque section, nous passerons en revue les services du fournisseur en question afin de parvenir à une solution d’apprentissage automatique réussie en tenant compte des données et de l'application, puisqu'elles sont au cœur de chaque projet d’apprentissage automatique;
Nous analysons ensuite les différents services offerts par le fournisseur de cloud et présentons une manière de les utiliser en symbiose afin de parvenir à une solution d’apprentissage automatique viable. | |
Public concerné |
|
Préalables |
|
Contenu | Introduction à l’apprentissage automatique Nous définissons ici ce qui est considéré comme un projet d’apprentissage automatique ainsi que les exigences en termes de données et d'applications. À cette fin, nous passerons en revue une série de cas d'utilisation concrets qui illustrent mieux les besoins en matière d’apprentissage automatique en tant que solution. Analyse des besoins Cette section traite principalement de l'infrastructure de calcul nécessaire à la mise en place d'un projet d’apprentissage automatique ainsi que les exigences en matière de données. Nous présentons tout d'abord les besoins en matière de stockage et d'annotation des données, puis la puissance de calcul et les estimations de coûts. Ces besoins changeront inévitablement en fonction du problème d’apprentissage automatique et de la nature des données, c'est-à-dire des données provenant de capteurs, le texte, des images, des vidéos, etc. Stockage des données Tout projet d’apprentissage automatique repose sur des données, et ces données doivent être stockées quelque part. Dans cette section, nous énumérons plusieurs types de données impliquées dans un projet d’apprentissage automatique et comment les stocker judicieusement; 1. Les données réelles sur lesquelles nous devons agir; les images dans un contexte de détection d'objet. Le texte, pour de la classification de documents. 2. Modèles; les modèles entraînés doivent être stockés et versionnés afin de pouvoir être interrogés. 3. Prédictions; la surveillance des prédictions des modèles est trop souvent laissée de côté. Les prédictions doivent être stockées et contrôlées afin d'analyser les performances d'un modèle déployé en temps réel. Services Amazon Web Services propose différentes granularités de stockage avec leurs cas d'utilisation très spécifiques; ● EFS ● S3 ● Glacier ● Base des données relationelles et NoSQL; ○ RDS ○ Elasticache ○ Timestream Etiquetage de données Il ne suffit pas d'avoir des données pour une solution d’apprentissage automatique ; il faut que ce soient des données propres. Pour ce faire, il est important d'envisager des outils d'annotation et de vérification. Encore une fois, cela diffère selon la nature des données, et nous allons passer en revue une série d'exemples (texte, images, etc.) Services ● SageMaker, avec “human-in-the-loop” Besoins computationnels L’entraînement des modèles d’apprentissage automatique est très différent de leur déploiement. Nous examinons les différents services qui répondent aux besoins du cycle de vie d'une solution d’apprentissage automatique. Services ● EC2 ● Batch ● Lambda ● Budget et explorateur de coûts Implémentation de la solution Dans le cadre d'un projet d’apprentissage automatique, nous étudions quels sont les services offerts par le fournisseur afin de mettre en œuvre la solution, c'est-à-dire utiliser les modèles disponibles ou les données annotées, former de nouveaux modèles pour répondre aux exigences souhaitées. Nous allons parcourir et analyser les outils de deux projets différents; 1. Recherche de documents 2. Classification d’images Solutions préconçues Services ● AWS Natural Language Processing ● AWS Image Classification/Object Detection Solutions sur mesures Les solutions personnalisées nécessitent des outils personnalisés et nous présentons comment nous pouvons les utiliser en symbiose afin de parvenir à une solution d’apprentissage automatique viable, là encore dans deux applications d’apprentissage automatique différentes. Services ● SageMaker ● EC2 ● S3 Déploiement de la solution Le déploiement d'une solution d’apprentissage automatique est très différent de l’entraînement de celle-ci. Il faut cependant réfléchir à la manière optimale de déployer le modèle, à la fréquence de réentraînement du modèle, à la surveillance des prévisions et à l'environnement de calcul. La plupart des modèles disponibles peuvent être déployés "tels quels". Cependant, le déploiement de modèles personnalisés est plus difficile. Points à prendre en considération; ● Servir l'application avec un équilibrage élastique des charges; ● Suivi des prédictions d'un modèle; ● Déploiement d'un nouveau modèle et repli sur une version précédente. |