Redes Neurais Convolucionais (CNN)
Introdução
Em geral
Uma rede neural convolucional é um tipo de rede neural artificial onde os neurônios artificiais correspondem a campos receptivos de maneira muito semelhante aos neurônios do córtex visual primário (V1) de um cérebro biológico.[1][2]Esse tipo de rede é uma variação de um perceptron multicamadas, porém, por sua aplicação ser realizada em matrizes bidimensionais, são muito eficazes para tarefas de visão artificial, como classificação e segmentação de imagens, entre outras aplicações.[3].
História
Os fundamentos das redes neurais convolucionais são baseados no Neocognitron, introduzido por Kunihiko Fukushima em 1980.[4] Este modelo foi posteriormente melhorado por Yann LeCun et al. em 1998[5] introduzindo um método de aprendizagem baseado em retropropagação para poder treinar o sistema corretamente. Em 2012, eles foram refinados por Dan Ciresan e outros, e foram implementados em uma unidade de processamento gráfico (GPU), alcançando resultados impressionantes.[6].
Fundações Biológicas
O trabalho realizado por Hubel e Wiesel em 1959[7] desempenhou um papel importante na compreensão de como funciona o córtex visual, particularmente as células responsáveis pela seletividade de orientação e detecção de bordas em estímulos visuais dentro do córtex visual primário V1. Dois tipos principais de células foram identificados aqui, estes com campos receptivos alongados, o que significa que têm uma melhor resposta a estímulos visuais alongados, como linhas e bordas. Estas são chamadas de células simples e células complexas.
As células simples possuem regiões excitatórias e inibitórias, ambas formando padrões elementares alongados em uma direção, posição e tamanho específicos em cada célula. Se um estímulo visual atinge a célula com a mesma orientação e posição, de forma que se alinhe perfeitamente aos padrões criados pelas regiões excitatórias e ao mesmo tempo evite a ativação das regiões inibitórias, a célula é ativada e emite um sinal.
As células complexas operam de maneira semelhante. Como células simples, estas têm uma orientação particular à qual são sensíveis. No entanto, estes não são sensíveis à posição. Portanto, um estímulo visual precisa chegar apenas na orientação correta para que essa célula seja ativada.