Chatbot RH et matching sémantique : transformer un ATS legacy en outil intelligent
25 février 2026
Le contexte
Une ETI spécialisée dans les services RH et l'intérim, 300 salariés répartis sur 15 agences en France. L'entreprise gère un portefeuille de 2 000 entreprises clientes et un vivier de 50 000 candidats actifs. Son ATS (Applicant Tracking System), développé en interne il y a 8 ans, centralise les données mais n'a jamais évolué au-delà de la gestion de fiches.
Le DSI connaît les limites du système, mais toute l'organisation dépend de cet outil — une migration complète est inenvisageable à court terme.
La problématique
Trois symptômes d'un même problème :
- Sous-exploitation de l'ATS — 70 % des fiches candidats sont incomplètes ou obsolètes. Les consultants complètent les données dans des fichiers Excel parallèles.
- Matching manuel — Pour chaque mission, un consultant parcourt manuellement les profils, en se fiant à sa mémoire et à des recherches par mots-clés exacts. Un candidat compétent mais mal référencé n'est jamais trouvé.
- Saturation des équipes — Chaque consultant traite 40 à 60 candidatures par jour. Les délais de réponse s'allongent, les candidats se tournent vers la concurrence.
La solution : chatbot + matching sémantique
Plutôt que de remplacer l'ATS, nous avons construit une couche d'intelligence par-dessus, connectée via API à la base existante.
Chatbot d'enrichissement des fiches candidats
Un chatbot conversationnel déployé sur le portail candidat existant. Au lieu d'un formulaire statique, le candidat dialogue avec le bot qui :
- Extrait les compétences du CV uploadé (parsing intelligent, pas de champs à remplir)
- Complète les données manquantes — mobilité, prétentions salariales, disponibilité, habilitations — via des questions contextuelles
- Met à jour la fiche ATS en temps réel via l'API interne
Le bot gère aussi les relances automatiques : candidats inactifs depuis 3 mois, mises à jour de disponibilité, nouvelles certifications.
Matching sémantique par embeddings
Le moteur de matching ne repose plus sur des mots-clés exacts mais sur des embeddings vectoriels :
- Chaque fiche candidat et chaque offre de mission sont transformées en vecteurs dans un espace sémantique commun
- Le matching calcule la similarité cosinus entre l'offre et les candidats, en intégrant les pondérations métier (compétences critiques vs. souhaitées, distance géographique, ancienneté sectorielle)
- Les résultats sont expliqués : pour chaque candidat suggéré, le système indique pourquoi il est pertinent (compétences alignées, proximité, disponibilité)
Stack technique et déploiement on-premise
- Backend : Python, FastAPI
- Base de données : PostgreSQL (même instance que l'ATS, schéma séparé)
- Embeddings : modèle OpenAI text-embedding-3-large, appels API avec données anonymisées
- Hébergement : OVHcloud bare metal, datacenter FR — exigence du client pour la conformité RGPD et la maîtrise des données RH
- Intégration : API REST bidirectionnelle avec l'ATS legacy (lecture/écriture des fiches candidats et des missions)
Les résultats
Après deux mois de déploiement progressif (3 agences pilotes, puis généralisation) :
- 3x candidatures traitées par jour — de 50 à 150 par consultant, grâce à l'automatisation du tri et de l'enrichissement
- -45 % de délai de placement — de 5,2 jours à 2,9 jours en moyenne
- 90 % d'adoption en 2 mois — les consultants ont adopté l'outil spontanément car il leur fait gagner du temps sans changer leurs habitudes
- Fiches candidats complètes : 89 % — contre 30 % avant (le chatbot comble les lacunes)
- Matching pertinent dès le top 5 — dans 82 % des cas, le candidat placé est dans les 5 premiers suggérés par l'IA
Les enseignements
S'intégrer à l'existant, pas le remplacer. L'ATS legacy reste la source de vérité. L'IA est une couche d'enrichissement et d'intelligence qui valorise les données existantes sans imposer de migration. C'est cette approche qui a convaincu le DSI — et permis un déploiement en semaines plutôt qu'en mois.
Le matching sémantique surpasse les mots-clés. Un candidat qui mentionne "gestion d'équipe de 12 personnes" est pertinent pour une mission demandant du "management". Les embeddings capturent ces proximités sémantiques que la recherche par mots-clés manque systématiquement.
Données RH = sécurité non négociable. Hébergement on-premise en France, données anonymisées avant tout appel API externe, chiffrement au repos et en transit, journalisation des accès. La conformité RGPD n'est pas un bonus — c'est un prérequis absolu dans le domaine RH.
Vous souhaitez augmenter votre outil RH existant avec de l'IA ? Parlons-en →