Construction d'une plateforme d'intelligence de marché pour l'assurance
Startup française de données sur l'assurance
Une startup française devait constituer une base de données exhaustive des compagnies d’assurance et de courtage. Nous avons livré l’infrastructure de données complète : agents de scraping, intégrations d’API tierces, base de données centrale et API de requêtes. Le fondateur s’est concentré sur la vente et le produit pendant que nous gérions tout l’aspect données.
Le Défi
Le client développait un produit entièrement dépendant de données qu’il ne possédait pas encore. Il avait besoin d’une base de données complète et structurée des sociétés d’assurance et de courtage, extraites de sources dispersées et non structurées sur le web. En tant que startup, il n’avait ni équipe d’ingénierie des données ni budget conséquent.
Le client vend de l’intelligence de marché aux compagnies d’assurance et courtiers : une base de données consultable de tous les acteurs du marché français de l’assurance, du courtage et du crédit. La valeur du produit repose sur l’exhaustivité et la précision. Or les données n’existent pas en un seul endroit. Elles sont réparties entre registres réglementaires, annuaires professionnels, sites web d’entreprises et fournisseurs de données tiers, chacun avec des formats, méthodes d’accès et fréquences de mise à jour différents. Le client disposait d’un développeur web pour le front end mais aucune capacité pour construire le pipeline d’acquisition et de traitement des données. Il avait besoin de quelqu’un pour gérer l’ensemble du backend : trouver les données, les collecter, les structurer, les stocker et les exposer via une API.
Notre Approche
Nous avons construit et opéré le pipeline de données complet. La phase un (4 semaines) s’est concentrée sur les agents de scraping pour les sources à plus forte valeur, gérant les protections anti-bots et les données non structurées. La phase deux (12 semaines) a ajouté la base de données centrale, les connecteurs API vers les fournisseurs de données tiers, des agents de scraping supplémentaires et l’API de requêtes qui alimente le front end du client. Les spécifications ont été rédigées en interne sur la base des besoins métier du client.
Ce Que Nous Avons Construit
Agents de web scraping
Agents personnalisés collectant des données depuis des sites réglementaires, des annuaires professionnels et des sites d’entreprises. Conçus pour contourner les protections anti-scraping et gérer des structures de pages non standardisées.
Intégrations d'API tierces
Connecteurs vers des fournisseurs de données externes, enrichissant les données collectées avec des attributs d’entreprise et des signaux de marché supplémentaires.
Base de données centrale
Une base de données structurée et dédupliquée des acteurs du marché de l’assurance, conçue pour des requêtes rapides et des mises à jour continues depuis toutes les sources de collecte.
API de requêtage
Une API de production qui expose la base de données à l’application front-end du client, supportant la recherche et le filtrage dont dépendent leurs utilisateurs.
Résultats
Le client a lancé son produit sur un backend de données complet et production-ready sans recruter d’équipe d’ingénierie des données. Le fondateur a pu se concentrer entièrement sur le développement commercial et le produit front-end. La mission s’est élargie au fil du temps avec l’émergence de nouvelles sources de données et exigences de collecte. Stratalis continue d’opérer et d’étendre la plateforme.
Avant & Après
| Métrique | Avant | Après |
|---|---|---|
| Équipe data engineering | None | Full pipeline, outsourced |
| Sources de données | Scattered, manual | Automated, multi-source |
| Délai de mise sur le marché | Blocked on data | 18 weeks to production |
| Temps du fondateur sur la data | Primary bottleneck | Zero |