Pionnier des ventes événementielles en ligne depuis 2001 🚀
Pionnier des ventes événementielles en ligne depuis 2001 et acteur incontournable du e-commerce en Europe, Veepee collabore avec plus de 7 000 marques pour proposer des produits à forte décote, disponibles sur une durée limitée. Présent dans de nombreux univers parmi lesquels la mode, la maison, le vin, le voyage, ou encore la beauté ... Veepee a réalisé en 2024 un chiffre d’affaires de 3,3 milliards d’euros TTC et compte 5 000 collaborateurs répartis dans 10 pays.
📄 DESCRIPTION DU POSTE
L’équipe Data Factory est responsable de la plateforme d’ingestion de données (Agate) permettant d’alimenter le Data Lake et le Data Warehouse de Veepee.
Dans un contexte de transformation stratégique (migration vers une architecture basée sur Trino / Iceberg / S3 on-prem), l’équipe renforce la fiabilité, la qualité et l’industrialisation des pipelines d’ingestion.
L’alternant(e) interviendra dans un environnement :
- Kubernetes / VPCloud
- Python / Java / Beam / Dataflow
- BigQuery & nouvelle stack Trino / Iceberg
- CI/CD (GitLab, tests automatisés)
- Observabilité & monitoring
🎯 MISSIONS
L'alternant contribuera à la fiabilisation et à l’industrialisation de la plateforme d’ingestion de données, afin de garantir une base solide pour l’ensemble des usages Data chez Veepee.
Activité 1 : Stabilisation de la stack d’ingestion
- Ajout de tests unitaires sur les pipelines existants
- Amélioration de la couverture de tests
- Détection des zones de fragilité
Activité 2 : Amélioration continue de la plateforme Agate
- Refactoring de composants techniques
- Participation à l’optimisation des performances
- Contribution à la gestion des erreurs et retry
Activité 3 : Qualité & fiabilité des données
- Mise en place de contrôles automatiques
- Contribution aux métriques de qualité
- Participation au monitoring technique
Activité 4 : Documentation & industrialisation
- Rédaction de README techniques
- Formalisation des bonnes pratiques
- Aide à la standardisation des nouveaux pipelines
Activité 5 : Participation aux projets stratégiques
- Contribution au double run (BigQuery ↔ nouvelle stack)
- Support aux équipes Data Governance / Science / Analytics
👉 PRÉ REQUIS
🎓 Formation
- Bac +3 à Bac +5 en informatique / data / école d’ingénieur
💻 Compétences techniques
- Bases solides en Python & Java
- Compréhension des APIs et pipelines de données
- Notions SQL
- Intérêt pour les architectures data modernes
🌍 Langues
🤝 Compétences comportementales
- Rigueur
- Curiosité technique
- Envie d’apprendre
- Esprit collaboratif
👉 LE PETIT PLUS
- Connaissance de Kubernetes
- Notions de CI/CD
- Expérience avec Airflow / Beam / Spark
- Sensibilité à la qualité logicielle
✅ AVANTAGES
- Prime variable
- Participation & intéressement
- Télétravail possible jusqu'à 2 jours/semaine
- Plateforme d'apprentissage des langues en ligne
- CSE et ses avantages
- Chèques CESU et chèques vacances
- Accès à une restauration d'entreprise et des frigos connectés
- Accès à la Salle de sport
❓ EN SAVOIR PLUS SUR L'ÉQUIPE
L’équipe Data Factory fait partie de la Data Platform.
Elle travaille en étroite collaboration avec :
- Data Governance
- Data Core
- Data Science
- Analytics
⚙️ PROCESSUS DE RECRUTEMENT
- Entretien RH
- Entretien technique (Data Factory)
- Cas pratique léger (optionnel)
- Entretien manager
The Veepee Group processes your data collected as part of the management of your recruitment in order to manage your application file for the position for which you have applied. To find out more about our personal data protection policy, we invite you to consult it on our career site.