(De)Construindo Vieses em Bases de Dados – Sandra Avila

(De)Construindo Vieses em Bases de Dados - Sandra Avila

Todos os conjuntos de dados contêm vieses, geralmente não intencionais, devido à forma como foram adquiridos e anotados. Esses vieses distorcem o desempenho dos modelos de aprendizado de máquina, criando correlações espúrias que os modelos podem explorar injustamente ou destruindo contrariamente correlações convincentes que os modelos poderiam aprender. Nesta apresentação, vamos explorar experimentos que revelam ambos os tipos de vieses, positivos e negativos, nos conjuntos de dados de lesões de pele. Nossos resultados mostram que os modelos podem classificar corretamente imagens de lesões de pele sem informações clinicamente significativas: perturbadoramente, o modelo de aprendizado de máquina aprendido sobre imagens onde não há informações sobre a lesão apresenta uma precisão acima do benchmark de IA curado com o desempenho de dermatologistas. Nossas principais descobertas aumentam a conscientização sobre as limitações de modelos treinados e avaliados em pequenos conjuntos de dados, como os que avaliamos, e podem sugerir diretrizes futuras para modelos destinados à implantação no mundo real. (Não será essa descrição a ser divulgada.)

Pesquisadora e Professora do Instituto de Computação da Universidade Estadual de Campinas. É doutora em Ciência da Computação pela UFMG e pela Universidade Pierre e Marie Curie (atual Sorbonne, Paris). Desenvolve projetos na área de Inteligência Artificial para saúde, análise de conteúdo sensível, agricultura de precisão e outras aplicações.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *