Publicado originalmente por MIT Technology Review
O maior estudo já feito sobre dados de reconhecimento facial mostra o quanto o aumento do aprendizado profundo alimentou a perda de privacidade.
Agora, um novo estudo mostra o quanto essa empresa corroeu nossa privacidade. Não apenas alimentou uma ferramenta cada vez mais poderosa de vigilância. A última geração de reconhecimento facial baseado em aprendizado profundo interrompeu completamente nossas normas de consentimento.
As pessoas eram extremamente cautelosas ao coletar, documentar e verificar dados faciais nos primeiros dias, diz Raji. “Agora não nos importamos mais. Tudo isso foi abandonado”, diz ela. “Você simplesmente não consegue acompanhar um milhão de rostos. Depois de um certo ponto, você não consegue nem fingir que tem o controle.”
Os pesquisadores identificaram quatro grandes eras do reconhecimento facial, cada uma motivada por um desejo crescente de melhorar a tecnologia. A primeira fase, que durou até a década de 1990, foi amplamente caracterizada por métodos manuais intensivos e computacionalmente lentos.
Mas então, estimulado pela percepção de que o reconhecimento facial poderia rastrear e identificar indivíduos com mais eficácia do que as impressões digitais, o Departamento de Defesa dos EUA investiu US$ 6,5 milhões na criação do primeiro conjunto de dados faciais em grande escala. Ao longo de 15 sessões fotográficas em três anos, o projeto capturou 14.126 imagens de 1.199 indivíduos. O banco de dados Face Recognition Technology (FERET) foi lançado em 1996.
A década seguinte viu um aumento na pesquisa acadêmica e comercial de reconhecimento facial, e muitos outros conjuntos de dados foram criados. A grande maioria foi obtida por meio de sessões de fotos como as de FERET e teve o consentimento total dos participantes. Muitos também incluíam metadados meticulosos, diz Raji, como idade e etnia dos sujeitos ou informações sobre iluminação. Mas esses primeiros sistemas tiveram dificuldades em ambientes do mundo real, o que levou os pesquisadores a buscar conjuntos de dados maiores e mais diversos…
Veja o artigo completo no site MIT Technology Review