Geração de Dados Sintéticos para Aprendizado de Máquina

Seminário especial do Visgraf

O treinamento de modelos de aprendizado de máquinas para a resolução eficaz de tarefas geralmente requer uma quantidade muito grande de dados. Apesar de gerarmos milhões de terabytes de dados todos os dias, não há dados suficientes para atender com precisão a diversos problemas. Coletar e organizar grandes volumes de dados para cada tipo de aplicação já seria um desafio considerável para muitos indivíduos e organizações. No entanto, seja por questões técnicas ou éticas, para conduzir pesquisas e criar aplicações de inteligência artificial, é preciso ter cuidados adicionais na construção desses conjuntos de dados, tais como a categorização e balaceamento dos exemplos e o respeito à privacidade das pessoas.

O uso de dados sintéticos para treinamento dos modelos pode ser uma solução para contornar vários dos problemas relacionados construção de conjuntos de dados. Estudos recentes apontam para a possibilidade de uso de dados sintéticos para treinamento de modelos que possam apresentar um bom desempenho quando aplicado a dados reais. Nesta série de três seminários, apresentaremos vantagens e limitações deste método, em particular, nas áreas de visão computacional e computação gráfica; como dados sintéticos podem ser gerados em larga escala com as ferramentas de computação gráfica disponíveis hoje em dia; e como essa ideia se expande para o aprendizado de máquina dentro de simulações.

Por que usar dados sintéticos?
26 de Maio de 2021

Neste seminário, vamos apresentar problemas que motivam o uso de dados sintéticos e discutir questões técnicas para o treinamento de...

Como gerar Dados Sintéticos e treinar um modelo com eles?
2 de Junho de 2021

Nesta apresentação, veremos como é possível realizar experimentos com a plataforma Unity para geração de dados sintéticos que podem ser...

Eles vivem em uma simulação? Treinamento de modelos em ambientes sintéticos dinâmicos
9 de Junho de 2021

Nesta terceira e última apresentação, veremos que as aplicações de dados sintéticos não se limitam a situações estáticas.