Jérémy Martin

Je suis
Passionné par l’ingénierie des données et l’assurance qualité, je suis Data Engineer & Data QA Expert, je me spécialise dans la création de pipelines de données robustes.
Mon objectif est d’assurer l’intégrité et la performance de vos données, tout en minimisant les risques liés à la qualité des processus.
Je suis déterminé à vous fournir des solutions fiables et de haute qualité en mettant à profit mes compétences.
Ensemble, transformons vos défis en opportunités grâce à des solutions à forte valeur ajoutée.

Experience

EPIDE (Alliance4U)
Consultant Testeur

Projet : Tierce Recette Applicative de la Nouvelle Application Métier (NAMe).

Contexte : L'EPIDE (Établissement pour l'insertion dans l'emploi) accompagne les jeunes de 18 à 25 ans sans diplôme ni emploi vers une insertion durable dans la société et le monde du travail, grâce à un cadre combinant formation, citoyenneté et sport. NAMe est l'outil de travail des agents qui centralise et facilite la gestion des démarches administratives, le suivi des jeunes et la coordination des interventions.

Click to see more...

Missions:

  • Etudier les spécification fonctionnelles.
  • Rédiger les cas de tests et définir les plans de tests.
  • Réalisation des campagnes de vérifications et de non régression.
  • Mise en place et maintient du catalogue de 115 tests automatisés (Click&Record).

Environnement Technique : Simplicité, Mabl, Jira, XRay.

Equipe : 1 test manageur, 1 consultant AMOA, 2 testeurs fonctionnels.

Lien : EPIDE

Click to go back...
Décembre 2023 - Novembre 2024 | Toulouse (Remote)
NANTES METROPÔLE (Alliance4U)
Consultant Testeur

Projet : Tierce Recette Applicative du site web des Bibliothèques Municipales.

Contexte : La métropôle de Nantes compte 8 Bibliothèques et 2 médiathèques. Dans le cadre de sa digitalisation, la ville a fait appel à un prestataire externe pour concevoir et réaliser un site web basé sur la technologie WordPress. La société Alliance4U a obtenue le marché de TRA pour assurer la vérification et la conformité avec les spécification fonctionnelles et le Plan d'Assurance Qualité de Nantes Métropôle.

Click to see more...

Missions:

  • Etudier les spécification fonctionnelles et le plan d'assurance qualité.
  • Rédiger le cahier de recette et les cas de tests (Fonctionnel, API, Intégreation).
  • Définir et mettre en place les jeux de données pour la bonne exécution des plan de tests.
  • Réaliser les campagnes de vérifications, le repporting et mise en place des livrables pour le client.

Environnement Technique : Jira XRay, Squash, WordPress.

Equipe : 1 testeur fonctionnel.

Lien : Nantes Ma Bibliothèque

Click to go back...
Janvier 2024 | Toulouse (Remote)
ALLIANCE4U
Consultant

Projet : C-SIL, le Système d'Information de Laboratoire de recherche collaboratif.

Contexte : Le LAB A4U, incubateur interne, soutient les projets des collaborateurs. C-SIL (socle applicatif) et STEM (module analytique), issus de cet incubateur, standardisent le traitement des données transcriptomiques tout en remettant le biologiste au coeur du processus et en réduisant les délais de traitement par les plateformes techniques. Après un POC réussi, nous avons souhaité co-construire la solution dans le cadre d'un partenariat académique.

Click to see more...

Mission :

  • Présenter l'idée au sein du LAB.
  • Concevoir un POC fonctionnel du module STEM.
  • Définir le modèle de financement de la conception jusqu'à N+2.
  • Présenter le projet aux grands acteurs locaux de la recherche académique.
  • Identifier les axes de collaborations possible pour co-construire la solution en partenariat avec un acteur académique (CNRS, INSERM, INRAE...)

Environnement Technique : Python, Flask, Docker, MongoDB, VueJS.

Equipe : 1 Expert UI/UX, 1 Dev Front, 1 Dev Back.

Click to go back...
Octobre 2023 - Janvier 2024 | Toulouse
INFINITY (INSERM UMR1291)
Bio Informatique

Projet : Ingénieur au sein de l'Immception Lab (N. Gaudenzio).

Contexte : L'équipe du Dr Nicolas Gaudenzio travaille sur la régulation neuronale de la réponse immunitaire. Dans ce cadre, elle mène de nombreux travaux de recherche à la frontière entre neurosciences et immunologie. Ces recherches utilisent les dernières technologies de séquençage à haut débit (RNA-seq, scRNA-seq, proteomiques etc...) et génèrent une grande quantité de données à traiter de bout en bout.

Click to see more...

Missions :

  • Mettre en place un pipeline de traitement pour automatiser le prétraitement de +2 To de données de séquençage.
  • Concevoir une base de données SQLite avec 150 interactions moléculaires d'intérêt pour le laboratoire.
  • Développer une WebApp RShiny pour faciliter la prise en main des données par les biologistes.
  • Contribuer au rayonnement scientifique :
    • 5 publications scientifiques, dont 2 collaborations internationales.
    • 2 invitations en tant que speaker aux journées scientifiques régionales de GenoToul.
  • Encadrer des étudiants de Master 1 (projet tutoré) et de Master 2 (stage de fin d'études) du Master Bioinformatique de Toulouse.

Environnement Technique : HPC SLURM, Bash / Linux, R, RShiny, Python, Streamlit, MariaDB, SQL, Git.

Equipe : 1 DR, 1 CRCN, 3 Post Doc, 3 Doctorantes.

Liens : INFINITY - Equipe 3 - Gaudenzio Lab

Click to go back...
Janvier 2021 - Septembre 2023 | Toulouse

Projets

stem logo
Ce Portfolio

Site personnel pour me présenter, mon parcours et mon activités.

Accomplishments
  • Outils: HTML, CSS, JS (un peu), FastAPI, Render, Git, Github Action, Github Pages, Github.
  • Basé sur un template.
  • CSS entièrement personnalisé.
  • Flip des #experience cards mis en place en pure CSS.
  • Merci de votre visite !
stem logo
STEM

Module d'analyse de donnée scRNA seq.

Accomplishments
  • Outils: Python, Flask, VueJS, MongoDB, Git, Bitbucket, Docker.
  • Gestion des différents projets experimentaux.
  • Algorithme de pré-traitement des données paramétrable.
  • Mise en place d'un onglet de visualisation de features.
  • Formulaire d'identification des clusters basés sur les niveaux d'expressions de marqueurs clefs.
stem logo
Toolbox - FeaturePlot

Outils de visualisation de données scRNA seq.

Accomplishments
  • Outils: R, RShiny, Git, Github.
  • Mise en place de jeux de tests pour se familiariser avec l'outil.
  • Possibilité d'uploader son propre data set.
  • Gestion des différents aspects de DataViz.
  • Hebergement sur ShinyApps.io

Compétences

Languages

pythonPython
htmlHTML5
cssCSS3
shellShell Scripting
RR

Manipulation des données

sqlSQL
duckdbDuckDB
pandasPandas
numpyNumpy
tidyverseTidyverse
sparkSpark

Machine learning

scikit learnSklearn (Python)
caretCaret (R)
kerasKeras (Python/R)

Cloud

RenderRender
GHPagesGithub Pages

Visualisation des données

matplotlibMatplotlib
seabornSeaborn
ggplot2ggplot2
plotlyPlotly

Tests

pytestPytest
mablmabl

API

fastapiFastAPI

Prototype web

flaskFlask
streamlitStreamlit
rshinyRshiny

Orchestrateur

slurmAirFlow
airflowAirFlow

Gestion du code

githubGithub
github actionGithub action

Formation

Data-Upskilling
Benjamin Dubreux

Résumé : Une formation dédiés aux Data Analyst et Data Scientist désireux de s'orienter dans le Data Engineering.

Description : Benjamin Dubreux est freelance dans la data depuis bientôt 10 ans. Il a vu le paysage de la data évolué et a identifié le socle technique indispensable pour pouvoir performer dans ces métiers.

Click to see more...

Modules :

  • Bash et Linux
  • SQL et SQL Avancés (CTE, Window Function, Joins,...)
  • Python Pro (FastAPI, Streamlit)
  • Data Engineering (Airflow, Spark)

Lien : Formation Data

Click to go back...
Juillet 2024 | Toulouse (Remote On-Demand)

ISTQB CFTL (v4)

Alliance Academy | 2023 - Toulouse

ISTQB Certified Foundation Tester Level

Certification : 22/12/2023

Practicals on machine and deep learning using R and Keras

GenoToul Biostatistique | 2022 Toulouse

Description : Prise en main de Keras via la librairie R : One Hot Encoding d'une sequence genomique et application d'un CNN pour identification de motifs d'intérêt.

Master Bioinformatique et Biologie des Systèmes
UT3 Paul Sabatier

Résumé : La bioinformatique est un domaine interdisciplinaire qui combine des outils informatiques et des techniques d'ingénierie logicielle pour stocker, analyser et modéliser de vastes ensembles de données biologiques.

Description : Ce master forme des experts capables d'utiliser des techniques informatiques avancées et des approches d'ingénierie logicielle pour analyser et modéliser de grandes quantités de données biologiques, tout en se spécialisant dans des domaines tels que la santé, les biotechnologies, et l'agronomie​.

Click to see more...

Cours significatif :

  • Algorithmique
  • Théorie des Graphes
  • Programmation pour la biologie (Python)
  • Introduction à Java
  • Bases de données relationnelles (SQL)
  • Base de données avancées (PL/SQL, Trigger, ...)
  • Fouille de données
  • Introduction à l'apprentissage automatique (ML/DL)
  • Biostatistiques
  • Mathématiques appliquées
  • Analyse multivariées et modélisation statistiques
  • Bioinformatique des séquences
  • Bioinformatique post-génomique (sequençage next-Gen)
  • Biologie des systèmes

Liens : Master BBS - UT3

Click to go back...
Septembre 2019 - Juin 2021 | Toulouse

Licence Biologie

UT3 Paul Sabatier | Toulouse

Mention : Biochimie, Biologie Moléculaire, Microbiologie

Option : Gestion de Projet et Immunologie Avancée

BTS Analyse de Biologie Médicales

Lycée Dr Lacroix | Narbonne

Option : Certificat de prélèvement sanguin

Contact

Vous pouvez me contacter via ce formulaire, je vous répondrais dans les plus brefs délais.