Question 1

Quelle est la fiabilité de ce détecteur de texte IA ?

Accepted Answer

Le détecteur analyse des patterns linguistiques statistiques : fréquence des expressions typiques de l'IA, uniformité de la longueur des phrases, richesse du vocabulaire et densité des connecteurs. Ce n'est pas un détecteur définitif. La précision est raisonnable pour les textes longs (plus de 150 mots), mais peut produire des faux positifs pour les écrits académiques formels et des faux négatifs pour les textes IA fortement réécrits par un humain.

Question 2

Quels patterns utilise-t-il pour détecter un texte IA ?

Accepted Answer

L'analyse combine six signaux : (1) présence d'expressions surutilisées par les LLM comme « il convient de noter », « explorer en profondeur » ou « en outre » ; (2) uniformité de la longueur des phrases (les modèles IA tendent à produire des phrases de longueur similaire) ; (3) richesse du vocabulaire via le ratio type-token (TTR) ; (4) densité des connecteurs formels ; (5) longueur moyenne des phrases ; (6) uniformité des paragraphes. Chaque signal possède un poids dans le score final.

Question 3

Peut-il détecter des textes de ChatGPT, Claude ou Gemini ?

Accepted Answer

L'outil analyse les patterns communs à tous les grands modèles de langage (GPT-4, Claude, Gemini, Llama, etc.) car ils partagent des biais similaires dans la génération de texte. Il ne distingue pas les modèles spécifiques. Il détecte les caractéristiques statistiques du texte généré par une IA en général, et non l'empreinte numérique d'un modèle particulier.

Question 4

Fonctionne-t-il avec du texte en français ?

Accepted Answer

Oui. L'outil détecte automatiquement la langue du texte (français, espagnol ou anglais) et applique la liste d'expressions correspondante. L'analyse statistique (uniformité des phrases, TTR, densité des connecteurs) fonctionne de manière équivalente dans toutes les langues.

Question 5

Pourquoi un texte humain formel peut-il donner un faux positif ?

Accepted Answer

Les textes académiques, juridiques ou techniques rédigés par des humains partagent certaines caractéristiques avec les textes IA : phrases longues et uniformes, vocabulaire spécialisé répété et nombreux connecteurs formels. C'est pourquoi le détecteur peut attribuer un score élevé à des textes humains formels. L'analyse est statistique, non sémantique : elle ne « comprend » pas le texte, elle mesure uniquement ses propriétés métriques.

Question 6

Qu'est-ce qui donne l'apparence d'un texte écrit par une IA ?

Accepted Answer

Les LLM tendent à produire des textes avec des longueurs de phrases très uniformes (faible variance), des connecteurs formels fréquents (« cependant », « en outre », « par conséquent »), des expressions caractéristiques (« il convient de noter », « il est important de mentionner »), un vocabulaire légèrement répétitif et des paragraphes de longueur similaire. Ces patterns émergent de l'apprentissage par renforcement avec retour humain (RLHF), qui favorise des réponses structurées et formelles.

Question 7

Est-ce la même chose que GPTZero ou Copyleaks ?

Accepted Answer

Non. GPTZero et Copyleaks utilisent des modèles de classification entraînés sur des millions de textes étiquetés, ce qui nécessite une infrastructure serveur. Cet outil fonctionne entièrement dans le navigateur sans envoyer votre texte à aucun serveur, en utilisant une analyse statistique transparente. L'avantage est une confidentialité totale et que la méthode est explicable : vous pouvez voir exactement quels signaux ont déclenché l'analyse.

Détecteur de Texte Généré par IA

Comment fonctionne le détecteur

Les six signaux

Limites importantes

Questions fréquentes

Dernière mise à jour