Cette offre de poste n'est plus disponible
EkimetricsPublié il y a 12 mois
Logo Ekimetrics

Stage 2025 - Data Science et Machine Learning/AI practitionner - Sujet : Finetuning de SLM pour preprocessing de RAG (H/F/N)

Juniors acceptés
Stage
Data Scientist
Deep learning
Anglais

Ekimetrics : Rejoignez notre équipe Data Science en tant que stagiaire en NLP GenAI ! 👩‍💻


À propos d'Ekimetrics

Ekimetrics est un leader en data science et fournisseur de solutions d'IA. Depuis 2006, nous utilisons la data science pour optimiser les performances marketing et commerciales, ainsi que pour favoriser une transition vers une performance plus durable.

Si vous êtes passionné.e de data, de technologie ou si vous souhaitez simplement être acteur.rice de votre avenir professionnel, votre place est sûrement chez Ekimetrics !

Quelques chiffres clés sur Ekimetrics

  • 400 expert.e.s en data science
  • 1000 projets divers et variés pour plus de 350 clients
  • 5 bureaux : Paris, Hong Kong, Shanghai, Londres et New York
  • 1 milliard de $ de profits générés pour nos clients depuis 2006

Notre ambition

Chez Ekimetrics, nous avons l'ambition d'accompagner nos clients à repenser leur business model en réconciliant performance économique et objectifs durables, grâce à la data science.

L'équipe Data Science que vous pourriez rejoindre

Le département Innovation d'Ekimetrics travaille sur des sujets de recherche en IA en collaboration avec nos partenaires industriels et académiques. L'équipe regroupe plusieurs docteurs experts dans le domaine de l'IA générative, du deep learning, de la vision par ordinateur, de la série temporelle, de l'explicabilité et de la causalité.

Le stage proposé

Le stage proposé vise à optimiser l'utilisation de petits modèles de langage (SLM <3B paramètres) dans des pipelines de traitement documentaire. L'objectif est d'explorer les techniques de fine-tuning spécifiques à ces modèles plus légers, en s'appuyant sur des approches comme LoRA, pour des tâches ciblées de parsing de documents.

Vos responsabilités

  • Assurer une veille sur l'état de l'art dans le domaine du deep learning et plus spécialement de l'IA générative et des SLM
  • Effectuer un travail de recherche au sein du département Innovation sur les techniques de fine-tuning et d'optimisation des modèles de langage
  • Implémenter et évaluer différentes approches de fine-tuning (LoRA, QLoRA, etc.) sur des modèles légers
  • Développer et optimiser des pipelines de traitement documentaire intégrant ces modèles
  • Mettre en place des protocoles d'évaluation rigoureux des performances des modèles
  • Respecter les bonnes pratiques de code pour produire un code clair et réutilisable
  • Partager vos connaissances en interne en apportant un support d'expert
  • Documenter les résultats de recherche et les implémenter sous forme de démonstrateurs

Le profil et les compétences recherchées

  • En stage de fin d'étude d'une grande école d'ingénieur ou autre master si compétences équivalentes, vous avez acquis de solides connaissances en deep learning, en NLP et en architectures transformer
  • Curiosité et autonomie dans la recherche de solutions innovantes
  • Expérience dans les méthodologies et bonnes pratiques de développement : Tests unitaires, versionning, CD/CI
  • Compétences approfondies en Python et développement orienté objet
  • Maîtrise des librairies Pytorch, Transformers (Hugging Face), numpy, sklearn
  • Expérience avec les techniques de fine-tuning de modèles de langage
  • Connaissances des architectures de modèles de langage (Transformer, attention, etc.)
  • Connaissances approfondies en probabilités, mathématiques et statistiques
  • Forte capacité d'analyse et de résolution de problèmes
  • Expérience en déploiement de LLM (un plus)
  • Anglais courant

Pourquoi nous rejoindre ?

Rejoindre Ekimetrics, c'est intégrer une entreprise dont les valeurs s'appliquent au quotidien :

  • Évoluer dans un environnement type start-up et non traditionnel (#curiosité)
  • Être capable de prendre le feedback pour s'améliorer (#excellence)
  • Se former dès son arrivée et en continu grâce à une expérience apprenante unique et riche de nombreuses ressources (internes, externes, live et digital) alliant savoirs techniques, savoir-être et savoir-faire (#transmission)
  • Faire partie d'une communauté accueillante et soudée (#plaisir)
  • Imaginer des solutions inattendues & sortir de sa zone de confort (#créativité)

Vous aurez accès à...

  • Au catalogue de formation EkiA qui contient des programmes qui vous feront monter en compétences sur nos solutions et nos métiers, des parcours apprenants sur notre plateforme digitale ainsi que des programmes dédiés à nos enjeux prioritaires, dont la sensibilisation aux sujets environnementaux avec la Climate School AXA.
  • Une vie sportive, artistique, musicale, ludique, caritative et engagée : de notre salle de sport privatisée à nos expositions d'art, en passant par des jeux vidéo et des concerts, ou encore les défis RSE sur la plateforme Vendredi ;
  • De nombreux évènements et séminaires pour rester proche de votre communauté ;
  • Des locaux modernes dans un quartier dynamique au cœur de Paris (Grands boulevards)
  • Une politique de télétravail flexible.

Notre processus de recrutement

  • Un test technique sur HackerRank
  • Un entretien RH avec un(e) Talent Acquisition
  • Une étude de cas avec un(e) Consultant(e)
  • Un entretien final avec un(e) Consultant(e) Senior

Nous serions ravi.e.s de vous donner de plus amples informations lors d'un entretien et attendons votre candidature avec impatience !

En tant qu'employeur, Ekimetrics offre à tous les mêmes opportunités d'accès à l'emploi sans distinction de genre, ethnicité, religion, orientation sexuelle, statut social, handicap et d'âge. Ekimetrics veille à développer un environnement de travail inclusif qui reflète la diversité dans ses équipes.

Référence :eki-data-lever+Ekimetrics-Stage-2025-Data-Science-et-Machine-LearningAI-practitionner-Sujet-Finetuning-de-SLM-pour-preprocessing-de-RAG-HFN

Skills

Data
Deep learning
Numpy
Pytorch
Back-end
Kong
Python
Soft skills
Anglais

Jobs similaires

brand cover
devops
FaureciaCDI
FaureciaCDI
Paris, FR
- Télétravail
Télétravail hybride
≥ 1 an d'experience
Python
Java
C++
Il y a 15 jours
brand cover
manager delivery operations - professional services (complex &amp; strategic deals) [carbon &amp; climate tech]
GreenlyCDI
GreenlyCDI
Paris, FR
- Télétravail
Télétravail hybride
≥ 5 ans d'experience
55k€ ➞ 55k€/an
Management
Go
Make
Il y a 13 heures
brand cover
machine learning engineer – practice ia margo
MARGOCDI
MARGOCDI
Paris, FR
- Télétravail
Télétravail hybride
Juniors acceptés
50k€ ➞ 70k€/an
Machine Learning
Docker
Kubernetes
Il y a 14 heures
brand cover
senior backend software engineer, voice squad
DiabolocomCDI
DiabolocomCDI
Barcelone, ES& 10 autres
- Télétravail
Télétravail hybride
≥ 10 ans d'experience
Java
Make
PostgreSQL
Il y a 15 heures
brand cover
stage 2026 - data science et machine learning/ai practitionner (h/f/n) (50% client, 50% r&amp;d)
EkimetricsStage
EkimetricsStage
Paris, FR
- Télétravail
Télétravail hybride
Juniors acceptés
21.6k€ ➞ 21.6k€/an
Machine Learning
D3
Deep learning
Il y a 15 heures
brand cover
stage 2026 - data science et machine learning/ai practitionner (100% r&amp;d)
EkimetricsStage
EkimetricsStage
Paris, FR
- Télétravail
Télétravail hybride
Juniors acceptés
21.6k€ ➞ 21.6k€/an
Kong
D3
Deep learning
Il y a 15 heures
brand cover
stage 2026 - data science et machine learning/ai practitionner - sujet : foundation models for tabular data (h/f/n)
EkimetricsStage
EkimetricsStage
Paris, FR
- Télétravail
Télétravail hybride
Juniors acceptés
21.6k€ ➞ 21.6k€/an
Deep learning
Machine Learning
Il y a 15 heures
brand cover
applied ai, forward deployed machine learning engineer - (internship)
Mistral AICDI
Mistral AICDI
Londres, GB& 1 autre
Pas de télétravail
Juniors acceptés
Machine Learning
Deep learning
Git
Il y a 18 heures
brand cover
software engineer, compute infrastructure
Mistral AICDI
Mistral AICDI
Londres, GB& 8 autres
- Télétravail
Télétravail hybride
≥ 3 ans d'experience
Kubernetes
Management
Datadog
Il y a 18 heures