Lors d'une analyse d'un smartphone j'ai été amené à regarder le contenu des données de l'application Tinder.
Dans le dossier /data/data/com.tinder/files
, on trouve un fichier nommé harmful_message_detection_downloaded_config.tsv
.
Il semble contenir des expressions régulières de mots nocifs. Voici ce qu'il contient pour la France :
(?<!p{L})anus(?!p{L})
(?<!p{L})bais(e|é|er|ai|ons|ez|ent)
(?<!p{L})branle(?!p{L})
(?<!p{L})chatte(?!p{L})
(?<!p{L})clito
(?<!p{L})cochonne(?!p{L})
(?<!p{L})connasse(?!p{L})
(?<!p{L})coquin(?!p{L})
(?<!p{L})couilles(?!p{L})
(?<!p{L})cuisses(?!p{L})
(?<!p{L})cul(otte)?(?!p{L})
(?<!p{L})cuni(?!p{L})
(?<!p{L})dominée(?!p{L})
(?<!p{L})enculer(?!p{L})
(?<!p{L})fellatio(s)?(?!p{L})
(?<!p{L})fess(é)?e
(?<!p{L})l(e|é|è)che(r)?(?!p{L})
(?<!p{L})levrette(?!p{L})
(?<!p{L})niqu(é|er|ai|ons|ez|ent)(?!p{L})
(?<!p{L})poitrine(?!p{L})
(?<!p{L})pute(s)?(?!p{L})
(?<!p{L})pénétration(?!p{L})
(?<!p{L})salope(?!p{L})
(?<!p{L})seins(?!p{L})
(?<!p{L})sodomie(?!p{L})
(?<!p{L})soumise(?!p{L})
(?<!p{L})suce(r)(?!p{L})
(?<!p{L})téton(s)?(?!p{L})
(?<!p{L})vagin(?!p{L})
Du coté US, on trouve entre autres les émoticônes :
- 🍆
- 💦
- 👉👌
- 🤤
On évitera donc de parler de "la petite chatte qui vient de naître et qui suce les tétons de sa mère."
Ainsi, je ne suis pas tout à fait d'accord avec le caractère nocif de toutes ces expressions et clairement il en manque, mais je trouve ça tout de même intéressant.