Переглядів 16,714
Dans cette vidéo, on introduit un nouveau modèle capable de faire de l'apprentissage par supervision : les réseaux de neurones. On les construit à partir de petites unités de calculs, les neurones, qui sont font un calcul très similaire à celui effectué par un modèle de régression logistique.
En deuxième partie de vidéo, on étudie d'où vient la "puissance" de ces réseaux de neurones par rapport aux modèles plus classiques, à partir de deux exemples.
L'article sur les features complexes calculées par les réseaux de neurones : www.lesswrong.com/posts/aPeJE...
(l'article parle d'abord des réseaux à convolution puis transpose cette idée sur les modèles de langage)
Me suivre :
Github : github.com/Procuste34
Twitter : / alexandretl2