La start-up Vicarious a amélioré une technique d'apprentissage automatique capable de résoudre les CAPTCHA en utilisant une nouvelle configuration réseau appelée Réseau cortical récursif.
L'objectif de Vicarious est de développer un algorithme qui peut toujours, dans chaque contexte, détecter certaines lettres. La détection de lettres dans diverses circonstances est considérée comme difficile pour les machines. Pour cette raison, le CAPTCHA (Test de Turing Public complet automatisé pour raconter l'histoire des ordinateurs et des humains) a été inventé pour distinguer les humains et les robots. En 2013, Vicarious a été l'un des premiers à craquer les systèmes CAPTCHA utilisant des réseaux neuronaux profonds.
Ils ont maintenant amélioré leur logiciel pour exiger moins de données pour mieux généraliser à tous les CAPTCHA. Normalement, les réseaux de neurones ont besoin de milliers à des millions d'exemples pour généraliser à de nouvelles données, inconnues. Leur nouveau système généralise mieux, avec 300 fois moins de données nécessaires à la formation.
Pour ce faire, ils ont inventé le réseau cortical récursif (RCN). Contrairement à un réseau neuronal normal, qui commence sans connaissance préalable avant l'entraînement, un RCN commence par la connaissance des contours et des surfaces. Cette connaissance préalable facilite la construction de modèles et la généralisation. Lorsqu'un réseau de neurones normal doit apprendre quels contours et quelles surfaces existent et doit apprendre la différence entre les objets et l'arrière-plan, un RCN commence par celle-ci. Grâce à cela, vous pouvez former un RCN sur plusieurs objets individuels et utiliser le réseau pour représenter des scènes avec plusieurs de ces objets.
L'idée derrière le RCN provient des sciences cognitives et des neurosciences. Quand les humains naissent, leur néocortex peut déjà différencier le premier plan et le fond. Cela facilite l'apprentissage des éléments de notre monde plutôt que de tout réapprendre de zéro.
Un RCN est modélisé comme une combinaison de contours et de surfaces. Les surfaces sont des modèles utilisant un champs aléatoire conditionnel. Les contours sont modélisés à l'aide d'une hiérarchie de caractéristiques. De cette façon, le RCN peut reconnaître des formes d'objets avec des apparences différentes sans s'entraîner sur chaque combinaison de formes et d'apparences. Un avantage supplémentaire des RCN est qu'elles ne s'ajustent pas à des détails superflus de l'ensemble d'apprentissage. Cela signifie qu'un RCN est capable de généraliser à d'autres scènes similaires.
La résolution des CAPTCHA est un domaine où la généralisation des techniques d'apprentissage automatique est très importante. Vicarious a observé qu'une légère perturbation dans le CAPTCHA rend leur approche de réseau neuronal traditionnelle inefficace. Ceci peut être observé dans l'image ci-dessous, où l'approche d'apprentissage en profondeur échoue si, après la formation des deux réseaux, la représentation du CAPTCHA est éditée. Leur nouvelle approche, formée avec seulement 260 échantillons d'entraînement, fonctionne bien mieux.
Pour générer des données de formation et de test, les chercheurs ont créé leurs propres CAPTCHA. Pour ces CAPTCHA, ils ont reproduit les polices de plusieurs systèmes de génération CAPTCHA bien connus. Les liens de téléchargement vers ces ensembles de données peuvent être trouvés au bas de leur blog.
Vicarious est une société américaine d'intelligence artificielle. Ils veulent généraliser à partir de quelques exemples d'entraînement, tout comme nous pouvons le faire en tant qu'êtres humains. Leur but ultime est d'appliquer cette intelligence en robotique. L'article sur le réseau cortical récursif a été publié dans un article de Science, et un article de blog sur leur site web.