Refonte totale du projet SARD (https://www.nist.gov/itl/ssd/software-quality-group/samate/software-assurance-reference-dataset-sard):
- Analyse de l'existant.
- Recueil des besoins auprès de l'équipe.
- Développement de POCs afin de valider certaines problématiques liés au projet.
- Etude de la faisabilité de migrer vers le format SARIF .
- Développement de la plateforme web avec Ruby On rails pour le backend et lit-dev pour le frontend.
- Déploiement de l'application grace à ansible.
- Standardisation de plus de 450 000 test cases test cases afin d'en faciliter leur utilisation (instructions de compilation, Dockerfile, SARIF...)
- Développement d'une CLI en golang afin d'aider l'équipe à préparer l'ajout de nouveaux test cases
Travail d'analyse sur le projet SATE (https://www.nist.gov/itl/ssd/software-quality-group/samate/static-analysis-tool-exposition-sate):
- Analyse de bugs sur des test cases écrit en C, C++ et java
- Rédaction de commentaires sur la nature des bugs
Travail expérimental sur l'impact des outils d'analyse de code tout au long du processus de développement d'un projet
Développeur web au sein de la filiale Diatelic de Pharmagest Interactive.
Ce stage s'inscrit dans le cadre du projet 36 mois de plus à domicile: Mise en place de solutions innovantes pour le maintien à domicile des personnes en début de perte d'autonomie. Mon objectif a été de prendre part à ce projet en apportant de nouvelles fonctionnalités:
- Mise en place d'une communication via le protocole Internet protocol event reporting
- Tests unitaires d'un service web
- Création de nouvelles notifications pour les proches des personnes
J'ai pu acquérir de nombreuses compétences grâce à ce stage:
- Développement du backend en J2EE.
- Développement du frontend en Angular 2/4 et ZK Framework
- Usage du framework Spring Boot afin de faciliter le développement
- Intégration continue (jenkins, sonarQube, code review)
- Pratique de la méthode SCRUM
- Codebase très importante en terme de taille: besoin de comprendre rapidement le code existant
- Rédaction de documentation et tutoriels pour des besoins internes à l'équipe
- Travail en autonomie
Développeur Perl dans l'équipe MULTISPEECH, collaboration avec trois membres: Irina Illina, Dominique Fohr ainsi que Imran Sheikh.
Un système de reconnaissance de la parole repose sur l'anayse statistique d'un corpus.
Dûs aux données diachroniques et au phénomène de néologisme de la société, ce système de reconnaissance ne permet pas de couvrir la totalité des mots existants, il est donc nécessaire de mettre à jour régulièrement le vocabulaire du système de reconnaissance. Le projet ContNomina se concentre sur les noms propres. Les noms propres représentent une source d’informations primordiales pour la recherche de documents, les activités de veille. L’exploitation des informations contextuelles disponibles dans la source audio peut permettre de retrouver les noms propres inconnus du système de reconnaissance et donc d’enrichir dynamiquement le vocabulaire du système de reconnaissance.
Mon rôle durant ces 10 semaines a été d'accompagner Imran Sheikh en développant plusieurs programmes répondant à ces besoins :
- Extraction de segments audios problématiques
- Programme de génération de phrases basée sur une grammaire
- Évaluation des erreurs de reconnaissance grâce à une matrice de confusion
- Évaluation de la recherche de noms propres
compétences travaillées:
- Communication exclusivement en anglais
- Apprentissage du langage Perl
- Travail en autonomie
- Théorie des langages (analyse lexical, syntaxique et sémantique)
- Francais
- Anglais
- Espagnol