O Facebook está a utilizar uma nova técnica de marcação de imagens utilizadas em machine learning, o qual chamou “dados radiativos”. O objetivo é ajudar os investigadores a compreenderem se determinado modelo de machine learning já foi treinada com o conjunto de imagens.

É um processo que à primeira vista é simples e sem utilidade, mas para os investigadores pode facilitar processos, sobretudo quando as máquinas estão a ser alimentadas com um grande pipeline de dados, em sistemas de grande escala. Nesse sentido, os dados podem ser marcados antes de serem colocados no pipeline, que depois de “carimbados” podem ser testados.

tek facebook
Exemplo de imagens com a marca de radiação para ajudar a "indexar" as imagens antes de serem utilizadas nos modelos de machine learning.

Esta “marca de água” pode ajudar os investigadores e engenheiros a compreender melhor como é que os colegas estão a treinar os seus modelos. O sistema pode mesmo ajudar a detetar potenciais tendências desses modelos.

O Facebook chama-lhes “dados radioativos” porque funcionam como uma analogia aos marcadores radioativos utilizados na medicina, como por exemplo em certas drogas, como o sulfato de bário, em que são observadas certas condições através de sistemas de tomografia computadorizada. A empresa refere que as marcas não têm impacto nos modelos, mas mantêm-se presentes no processo de aprendizagem, sendo detetadas facilmente pelas redes neurais.