Whisper IA fine-tuné — hébergement France RGPD

Transcription IA des appels auto-école : la fin de la réécoute manuelle.

Vos messages vocaux transcrits automatiquement en texte par Whisper IA fine-tuné pour le français et le vocabulaire auto-école. Précision ~95 %, hébergement France, RGPD. Inclus dans Permolib Pro à 89 €/mois HT — vous lisez en 5 secondes ce qui prenait 60 secondes d'écoute.

  • ~95 % de précision sur le français standard auto-école
  • Auto-tag d'intention (inscription, tarif, reprogrammation, autre)
  • Hébergement France, modèle Whisper auto-hébergé (pas OpenAI cloud)
  • Recherche full-text sur toutes les transcriptions historiques
Transcription IA des messages vocaux d'auto-école avec Whisper fine-tuné français
  • 40-0

    appels manqués par mois en moyenne

  • < 0s

    pour envoyer le SMS automatique

  • 0%

    des SMS auto reçoivent une réponse

Pourquoi transcrire

Le gain de temps réel d'avoir ses messages vocaux en texte

Un message vocal d\'auto-école dure typiquement 30 à 90 secondes. Écouter chaque message à la main, le matin quand vous avez 5-15 messages accumulés de la veille, représente 15 à 30 minutes de réécoute quotidienne. Avec une transcription IA, ce temps tombe à 5-10 minutes de lecture rapide — vous récupérez 1h+ par semaine, mécaniquement.

Au-delà du gain de temps, la transcription change la qualité de votre rappel. Vous arrivez sur l\'appel avec le contexte complet (« la personne cherche un forfait B + code, mentionne CPF, préfère cours le soir »), pas avec un vague souvenir de message vocal. Notre data client : les rappels avec contexte transcrit ont un taux de conversion 1,5× supérieur aux rappels « à froid ».

CritèreSans transcription IAAvec Permolib (Whisper IA)
Précision sur français standardN/A (vous écoutez)~95 % (Whisper large fine-tuned FR)
Détection des numéros énoncésVous notez à la mainExtrait automatique du numéro de rappel mentionné
Détection du nom de la personneVous notez à la mainExtrait quand énoncé clairement
Catégorisation intentionManuelleAuto-tag (inscription, tarif, reprogrammation, autre)
Temps de traitement par message30-60 secondes d'écoute< 60 secondes en différé (vous lisez 5 secondes)
Recherche dans l'historiqueImpossibleRecherche full-text sur toutes les transcriptions
Export et analyseImpossibleExport CSV mensuel, intégrable analytics
Comment ça marche

De la voix au texte structuré dans votre pipeline CRM

Voici la chaîne technique complète qui se déclenche quand un prospect laisse un message vocal sur votre répondeur Permolib :

  1. Capture audio : le message vocal est enregistré en qualité MP3 192 kbps sur notre infrastructure France.
  2. Transcription Whisper : l\'audio est envoyé à notre instance Whisper auto-hébergée (modèle whisper-large-v3 fine-tuné sur du français auto-école). Délai typique : 30-60 secondes.
  3. Post-traitement : extraction du numéro de rappel mentionné, du nom si épelé clairement, détection de l\'intention (4 catégories : inscription, tarif, reprogrammation, autre).
  4. Création du lead : un lead est créé dans votre pipeline CRM avec la transcription complète, le tag d\'intention, le numéro de rappel auto-rempli, le statut « à rappeler ».
  5. Notification : vous recevez une notification dashboard (ou email selon votre config). Vous pouvez consulter la transcription, écouter l\'audio original si besoin, et rappeler en 1 clic.

Aucune action manuelle de votre part — toute la chaîne est automatique. Vous voyez le lead apparaître dans votre dashboard moins de 90 secondes après que le prospect a raccroché.

Données vocales — RGPD et hébergement France

Les messages vocaux et transcriptions sont stockés sur nos serveurs en France. Aucune donnée audio n\'est envoyée chez OpenAI ou Google pour l\'entraînement de leurs modèles — Permolib utilise une instance Whisper auto-hébergée (modèle open source, déployé sur notre infrastructure). Les transcriptions sont conservées 24 mois maximum dans votre pipeline CRM, puis supprimées automatiquement (sauf si vous activez la conservation longue durée).

Conformité RGPD : registre de traitement à jour, bases légales documentées (intérêt légitime pour la création de lead + consentement implicite via l\'appel à votre numéro affiché publiquement), droit à l\'effacement implémenté en 1 clic depuis le dashboard. DPO interne joignable à dpo@permolib.fr.

Limites assumées

Ce que la transcription IA ne fait pas (encore)

Soyons honnêtes sur les limites actuelles pour que vous ne soyez pas surpris :

  • ~5 % d\'erreurs sur français standard, principalement sur les noms propres rares et les numéros énoncés très vite. Vous gardez accès à l\'audio original pour vérifier les cas ambigus.
  • Précision réduite sur accents très marqués (régionaux ou étrangers). Peut tomber à 85-90 % sur certains profils. Whisper est meilleur que la moyenne mais pas parfait.
  • Pas d\'analyse de sentiment dans la V1. La transcription est purement textuelle — on ne tag pas le ton (urgent, frustré, hésitant) automatiquement. C\'est sur la roadmap 2026 H2.
  • Pas de transcription temps réel pendant l\'appel. La transcription se fait après que le prospect a raccroché, sur le message vocal complet. Pas de « live transcription » de l\'appel en cours.
  • Pas encore d\'auto-réponse contextuelle. Permolib ne génère pas encore de SMS de rassurance personnalisé en fonction du contenu de la transcription — c\'est le même SMS pour tout le monde. Sur la roadmap 2026 H2.

Si l\'un de ces points est bloquant pour vous, dites-le nous — nous priorisons la roadmap en fonction des retours clients. Les fonctionnalités citées comme « roadmap 2026 H2 » sont activement développées.

Ils utilisent Permolib

Ce que disent les gérants

« Sur 50 appels manqués, 38 ont reçu un SMS et 12 sont devenus élèves. Permolib paie son abonnement en 3 jours. »
Jean M.Gérant, Lyon
FAQ

Questions fréquentes

Quel moteur de transcription utilise Permolib ?

Whisper d'OpenAI, modèle large-v3, auto-hébergé sur notre infrastructure France (pas appelé via l'API OpenAI cloud). Le modèle est fine-tuné sur du français standard avec un dataset auto-école pour améliorer la précision sur le vocabulaire métier (forfait B, livret d'apprentissage, code, conduite, CPF, etc.). Le code de l'inférence est entièrement chez nous, aucune donnée audio ne quitte la France.

Quelle est la précision réelle de la transcription en pratique ?

Sur français standard adulte avec accent faible : ~95 % de précision (1 mot sur 20 incorrect, généralement des noms propres rares ou des numéros énoncés très vite). Sur accents marqués (régionaux, étrangers) : 85-90 %. Sur murmures ou voix très basse : 75-85 %. Vous gardez systématiquement accès à l'audio original pour vérifier les cas ambigus depuis le dashboard.

La transcription IA fonctionne-t-elle en temps réel pendant l'appel ?

Non, pas en temps réel. La transcription se déclenche après que le prospect a raccroché, sur le message vocal complet. Délai typique : 30-60 secondes entre raccrochage et apparition de la transcription dans le pipeline. Pour de la transcription live d'un appel en cours, c'est une fonctionnalité plus complexe (latence, qualité variable) qui n'est pas dans la roadmap Permolib actuelle.

Combien coûte la transcription en plus du tarif Permolib ?

Rien. La transcription IA est incluse dans l'abonnement Pro à 89 €/mois HT, sans surfacturation au volume de messages transcrits. Pour une auto-école normale (50-100 messages vocaux/mois), c'est largement absorbé dans le coût infrastructure que nous portons. Pour des volumes très exceptionnels (1000+ messages/mois), on regarde au cas par cas — mais aucun de nos clients actuels n'atteint ce seuil.

Mes données vocales sont-elles utilisées pour entraîner les modèles IA ?

Non, jamais. Nos données client ne partent pas chez OpenAI/Google/Anthropic — nous utilisons Whisper en mode auto-hébergé (modèle open source téléchargé une fois et déployé sur nos serveurs France). Les transcriptions et l'audio restent sur votre pipeline pendant 24 mois maximum (configurable), puis sont supprimés automatiquement. Aucun usage secondaire pour l'entraînement ou la commercialisation.

Puis-je désactiver la transcription IA si je préfère écouter manuellement ?

Oui, dans les paramètres du dashboard, vous pouvez désactiver la transcription automatique. Les messages vocaux sont alors stockés en audio uniquement, sans génération de texte. Vous les écoutez manuellement depuis le pipeline. Désactivation utile si vous préférez l'écoute (par habitude ou pour percevoir le ton du prospect), même si la majorité de nos clients la gardent activée pour le gain de temps.

Comment chercher dans l'historique des transcriptions ?

Recherche full-text disponible dans le dashboard Permolib : barre de recherche en haut → tape un mot-clé (« CPF », « forfait », « moto », nom de prospect, etc.) → résultats triés par date. Pratique pour retrouver un prospect dont on a oublié le nom mais dont on se rappelle d'un détail mentionné dans le message. Aussi accessible via l'API webhook pour les usages avancés (plan Business).

Prêt à voir si Permolib peut vous aider ?

30 minutes d'échange avec un membre de notre équipe pour évaluer votre situation et configurer Permolib avec vous.