Détecteur de Texte Généré par IA

Collez un texte et analysez s'il a été généré par une IA. L'analyse est locale : votre texte n'est jamais envoyé à aucun serveur.

Analyser le texte
0 mot
0%
Prob. IA

Détail des signaux
SignalValeurIntensitéPoids
Marqueurs détectés dans le texte
Expressions typiques de l'IA Connecteurs formels
Limites de l'analyse : Ce détecteur utilise des patterns linguistiques statistiques, pas un modèle de classification. Ce n'est pas un détecteur définitif. Un texte académique formel rédigé par un humain peut obtenir un score élevé. Un texte IA fortement révisé peut obtenir un score faible. Utilisez-le comme guide, pas comme preuve concluante.

Comment fonctionne le détecteur

Contrairement à des outils comme GPTZero ou Copyleaks, ce détecteur n'envoie pas votre texte à aucun serveur et n'utilise pas de modèle de classification entraîné. Toute l'analyse s'effectue dans votre navigateur, en temps réel, à partir de six signaux statistiques sur la structure linguistique du texte.

Les six signaux

1. Expressions caractéristiques de l'IA. Les modèles de langage surutilisent certaines expressions de transition et de remplissage : « il convient de noter », « explorer en profondeur », « en outre », « multidimensionnel », « dans le domaine de ». L'outil détecte plus de cinquante de ces expressions en français, en espagnol et en anglais.

2. Uniformité de la longueur des phrases. Les humains mélangent naturellement des phrases courtes et longues. Les LLM tendent à produire des phrases de longueur très uniforme. L'écart-type des longueurs de phrases est mesuré : un faible écart-type (inférieur à 4 mots) est un signal statistique de génération automatique.

3. Richesse du vocabulaire (TTR). Le ratio type-token (TTR) mesure le nombre de mots uniques par rapport au nombre total de mots. Les textes IA tendent à avoir un vocabulaire légèrement plus répétitif que l'écriture humaine spontanée, surtout dans les textes longs.

4. Densité des connecteurs formels. Les LLM utilisent des connecteurs tels que « cependant », « néanmoins », « par conséquent », « en conséquence » plus fréquemment que les textes humains informels. Le pourcentage de mots qui sont des connecteurs formels est mesuré.

5. Longueur moyenne des phrases. Les modèles IA évitent les extrêmes : ils produisent rarement des phrases de 2-3 mots ou de 50 mots. La longueur moyenne des phrases se situe généralement entre 15 et 25 mots.

6. Uniformité des paragraphes. Les textes IA tendent à avoir des paragraphes de longueur très similaire. La variance de la longueur des paragraphes est un signal supplémentaire de rédaction humaine.

Limites importantes

L'analyse statistique ne « comprend » pas le texte. Un essai rédigé par un professeur d'université peut obtenir un score élevé car il partage des caractéristiques formelles avec le texte IA. Un texte IA soigneusement révisé par un humain peut obtenir un score faible. Le détecteur est un outil d'orientation, pas un arbitre définitif.

Pour les textes très courts (moins de 100 mots), l'analyse statistique ne dispose pas de suffisamment de données et les résultats ne sont pas fiables. L'outil affichera un avertissement dans ce cas.

Questions fréquentes

Quelle est la fiabilité de ce détecteur de texte IA ?
Le détecteur analyse des patterns linguistiques statistiques : fréquence des expressions typiques de l'IA, uniformité de la longueur des phrases, richesse du vocabulaire et densité des connecteurs. Ce n'est pas un détecteur définitif. La précision est raisonnable pour les textes longs (plus de 150 mots), mais peut produire des faux positifs pour les écrits académiques formels et des faux négatifs pour les textes IA fortement réécrits par un humain.
Quels patterns utilise-t-il pour détecter un texte IA ?
L'analyse combine six signaux : (1) présence d'expressions surutilisées par les LLM comme « il convient de noter », « explorer en profondeur » ou « en outre » ; (2) uniformité de la longueur des phrases (les modèles IA tendent à produire des phrases de longueur similaire) ; (3) richesse du vocabulaire via le ratio type-token (TTR) ; (4) densité des connecteurs formels ; (5) longueur moyenne des phrases ; (6) uniformité des paragraphes. Chaque signal possède un poids dans le score final.
Peut-il détecter des textes de ChatGPT, Claude ou Gemini ?
L'outil analyse les patterns communs à tous les grands modèles de langage (GPT-4, Claude, Gemini, Llama, etc.) car ils partagent des biais similaires dans la génération de texte. Il ne distingue pas les modèles spécifiques. Il détecte les caractéristiques statistiques du texte généré par une IA en général, et non l'empreinte numérique d'un modèle particulier.
Fonctionne-t-il avec du texte en français ?
Oui. L'outil détecte automatiquement la langue du texte (français, espagnol ou anglais) et applique la liste d'expressions correspondante. L'analyse statistique (uniformité des phrases, TTR, densité des connecteurs) fonctionne de manière équivalente dans toutes les langues. Pour les textes dans d'autres langues, l'analyse statistique est appliquée sans la liste d'expressions spécifique à la langue.
Pourquoi un texte humain formel peut-il donner un faux positif ?
Les textes académiques, juridiques ou techniques rédigés par des humains partagent certaines caractéristiques avec les textes IA : phrases longues et uniformes, vocabulaire spécialisé répété et nombreux connecteurs formels. C'est pourquoi le détecteur peut attribuer un score élevé à des textes humains formels. L'analyse est statistique, non sémantique : elle ne « comprend » pas le texte, elle mesure uniquement ses propriétés métriques.
Qu'est-ce qui donne l'apparence d'un texte écrit par une IA ?
Les LLM tendent à produire des textes avec des longueurs de phrases très uniformes (faible variance), des connecteurs formels fréquents (« cependant », « en outre », « par conséquent »), des expressions caractéristiques (« il convient de noter », « il est important de mentionner »), un vocabulaire légèrement répétitif et des paragraphes de longueur similaire. Ces patterns émergent de l'apprentissage par renforcement avec retour humain (RLHF), qui favorise des réponses structurées et formelles.
Est-ce la même chose que GPTZero ou Copyleaks ?
Non. GPTZero et Copyleaks utilisent des modèles de classification entraînés sur des millions de textes étiquetés, ce qui nécessite une infrastructure serveur. Cet outil fonctionne entièrement dans le navigateur sans envoyer votre texte à aucun serveur, en utilisant une analyse statistique transparente. L'avantage est une confidentialité totale et que la méthode est explicable : vous pouvez voir exactement quels signaux ont déclenché l'analyse.

Dernière mise à jour

Détecteur mis à jour en 2026. L'analyse est entièrement locale : votre texte ne quitte jamais votre appareil.