CBM 35 IMPA

Visgraf

Sessão Temática de Visão e Computação Gráfica

Segunda-feira, 28 de julho · Visão

14:15 às 16:15

Leitura de Cartões Resposta da OBMEP
Lucas Nissenbaum (IMPA)
Aprendizado de Máquina Científico: Redes Neurais na Modelagem de Dinâmicas Físicas
Vitor Balestro (UFF / IMPA)
Computação visual aplicada à análise de comportamento humano
João Paulo Lima (UFRPe)
Uma introdução a gaussian splatting
Daniel Perazzo (IMPA)

16:15 às 16:30 · intervalo

16:30 às 18:30

What’s missing in multimodal AI? Towards spatial awareness, effective tool use and fine-grained understanding
Andre Araujo (Google DeepMind)
Inteligência artificial no combate ao abuso sexual infantil
Leo Ribeiro (ICMC-USP)
TBA
Jorge Poco (FGV EMAp)
Enhancing realistic rendering for mixed and virtual reality games
Esteban Clua (UFF)

Terça-feira, 29 de julho · Computação Gráfica

14:15 às 16:15

The generalized singular value decomposition
João Paixão (UFRJ)
Geração automática de arte de tampinhas de garrafa
Leonardo Sacht (UFSC)
Visualização de dados: Um mergulho teórico e uma proposta de avanço
Asla Sá (IMPA Tech)
Primeiras experiências em computação gráfica
Gabriel Ferreira (IMPA Tech)

16:15 às 16:30 · intervalo

16:30 às 18:30

Representation and rendering of intrinsic triangulations
Waldemar Celes (PUC-Rio)
Animação digital de avalanches de neve
Afonso Paiva (ICMC-USP)
Inteligência artificial na mamografia: segmentação de estruturas, classificação de densidade e controle de qualidade
Alberto Raposo (PUC-Rio)

Resumos

What’s missing in multimodal AI? Towards spatial awareness, effective tool use and fine-grained understanding
Andre Araujo (Google DeepMind)

The recent progress in multimodal AI systems has enabled a variety of applications, such as natural chatbot interactions, smooth information-seeking journeys and promising robotics deployments. Despite the significant advancements in the past few years, these systems still face challenges in a number of areas. In this talk, I will highlight recent work from my team and collaborators to enhance three important aspects: spatial awareness, effective tool use and fine-grained understanding. Taken together, these ideas offer directions for designing ever-more-capable multimodal systems and experiences.

Inteligência artificial no combate ao abuso sexual infantil
Leo Ribeiro (ICMC-USP)

O projeto Araceli é uma parceria UNICAMP-UFMG-USP que desenvolve soluções de Inteligência Artificial para a detecção automática de materiais de abuso sexual infantil (child sexual abuse material, CSAM). Contamos com colaborações essenciais com a Polícia Federal e Polícia Técnico-Científica do Estado de São Paulo, pois apenas profissionais treinados podem manipular este tipo de dado. Neste Seminário vamos falar sobre o processo de trabalhar com estes materiais e principalmente como obter resultados sem ter acesso direto ao conteúdo sensível.

Enhancing realistic rendering for mixed and virtual reality games
Esteban Clua (UFF)

The video game industry continuously advances real-time rendering techniques, with an increasing focus on features like ray-tracing and global illumination. Additionally, VR/MR/AR games are pushing for high-quality rendering despite constraints such as high-definition displays (requiring many pixels), less powerful processors, and higher frequency requirements. This talk will present key optimization strategies, including hybrid denoising, foveated culling methods, optimization for foveated displays, and the usage of neural rendering approaches.

Computação visual aplicada à análise de comportamento humano
João Paulo Lima (UFRPe)

A Computação Visual para Análise de Comportamento Humano (Human Analytics) combina visão computacional e inteligência artificial para analisar o comportamento humano a partir de imagens e vídeos. Aplicada em áreas como saúde, segurança e marketing, ela permite o monitoramento e interpretação de gestos, expressões faciais e movimentos corporais em tempo real. Usando técnicas como aprendizado profundo e reconhecimento de padrões, essa tecnologia é capaz de detectar emoções, prever comportamentos e otimizar processos, como a interação humano-máquina. Assim, a Computação Visual tem transformado a análise de dados comportamentais, criando novas oportunidades para inovação e automação. A palestra discutirá sobre as últimas tendências na área de Computação Visual para Human Analytics, apresentando o estado da arte e as futuras direções de pesquisa da área.

Uma introdução a gaussian splatting
Daniel Perazzo (IMPA)

O problema de reconstrução 3D é considerado um dos principais desafios nas áreas de computação gráfica e visão computacional. Nesta palestra, faremos uma breve introdução a Gaussian Splatting, uma das técnicas mais promissoras para esse problema, com resultados impressionantes tanto em velocidade quanto em qualidade de reconstrução. Explicaremos as bases matemáticas do método e discutiremos algumas de suas aplicações.

Inteligência artificial na mamografia: segmentação de estruturas, classificação de densidade e controle de qualidade
Alberto Raposo (PUC-Rio)

Esta palestra apresenta avanços no uso de inteligência artificial para apoiar a análise de exames de mamografia. Serão discutidas abordagens para identificar estruturas importantes da mama, estimar a densidade mamária e avaliar a qualidade das imagens. Além disso, mostramos como essas informações podem ser organizadas em relatórios visuais e objetivos que auxiliam profissionais de saúde na tomada de decisão. Os métodos apresentados foram testados em diferentes conjuntos de dados e mostraram resultados consistentes, com potencial para aplicação na prática clínica.

Representation and rendering of intrinsic triangulations
Waldemar Celes (PUC-Rio)

Existing intrinsic triangulation frameworks represent powerful tools for geometry processing; however, they all require the extraction of the common subdivision between extrinsic and intrinsic triangulations for visualization and optimized data transfer. In this talk, an efficient and effective algorithm for directly rendering intrinsic triangulations is presented. The strategy is to use GPU shaders to render the intrinsic triangulation while rasterizing extrinsic triangles. The algorithm relies on a point-location algorithm supported by a compact data structure, which requires only two values per extrinsic triangle to represent the correspondence between extrinsic and intrinsic triangulations. This data structure is easier to maintain than previous proposals while supporting all the standard topological operations for improving the intrinsic mesh quality, such as edge flips, triangle refinements, and vertex displacements. Computational experiments show that the proposed data structure is numerically robust and can process nearly degenerate triangulations. A meshless strategy to accurately transfer data from intrinsic to extrinsic triangulations will also be presented.

The generalized singular value decomposition
João Paixão (UFRJ)

The Generalized Singular Value Decomposition (GSVD) is a matrix factorization technique that extends the classical Singular Value Decomposition (SVD) to pairs of matrices, providing a simultaneous decomposition that reveals their shared and individual structures. By decomposing two matrices A and B into generalized singular vectors and values, GSVD enables robust analysis of coupled data structures, making it a valuable tool in computational mathematics and applied sciences. In computer vision, GSVD is used for feature extraction, subspace learning, and multi-view dimensionality reduction. In this talk, we will present the theory behind the GSVD and its applications.

Geração automática de arte de tampinhas de garrafa
Leonardo Sacht (UFSC)

Propomos um novo problema em processamento de imagens: aproximar uma imagem dada com um conjunto de tampinhas de garrafa de plástico. Este problema é motivado pela apreciação causada por imagens de baixa resolução combinada com o objetivo de achar um novo destino para tampinhas de plástico, cujo descarte inapropriado causa dano ambiental especialmente a animais do mar. Apresentamos dois métodos: um modela o problema como maximização de uma função objetivo que quantifica quão similares são uma imagem comum a uma imagem de tampinhas de garrafa e o outro, mais rápido, divide a imagem em regiões e determina a melhor cor de tampinhas para cada região. Exemplos demonstram que nossos métodos produzem resultados de alta qualidade mesmo neste contexto de resoluções espacial e de cor muito baixas.

Animação digital de avalanches de neve
Afonso Paiva (ICMC-USP)

Este trabalho apresenta um método baseado em física usando o Método de Volume Finito para simular avalanches de neve em pó sobre terrenos complexos. Especificamente, o objetivo principal é simular a dinâmica turbulenta da nuvem de neve dentro da avalanche de uma maneira visualmente realista. Trabalho em colaboração com Filipe Nascimento (Adobe) e Fabricio S. Sousa (ICMC-USP).

Primeiras experiências em computação gráfica
Gabriel Ferreira (IMPA Tech)

A palestra abordará experiências dos alunos graduandos do IMPA Tech no curso de verão "Reproduzindo Resultados em Computação Gráfica", discutindo os contatos e as formas de encarar problemas que existem na computação gráfica enquanto adaptam algoritmos de papers clássicos. Este trabalho visa além de explicar o funcionamento desses algoritmos, mostrar um pouco do processo de tomadas de decisões para a adaptação dos artigos nas linguagens de programação dos dias atuais. Diante disso, técnicas básicas como leitura de imagens e aplicações de efeitos monocromáticos foram incorporadas a algoritmos clássicos de meio tom digital. Além disso, serão mostrados teoremas matemáticos como curvas de recobrimento de espaço.

Leitura de Cartões Resposta da OBMEP
Lucas Nissenbaum (IMPA)

Nesta palestra, apresentaremos um projeto em desenvolvimento pelo Centro de Projetos e Inovação (Centro Pi) do IMPA. Este projeto consiste na leitura de cartões resposta da Olimpíada Brasileira de Matemática das Escolas Públicas (OBMEP), com informações como nome, CPF e as respostas marcadas pelos alunos. Apresentaremos as dificuldades encontradas nas imagens e os objetivos deste desafio. Depois será discutida a estrutura utilizada para a resolução deste problema. Apresentaremos modelos de visão computacional utilizados para alinhamento e retificação dos mesmos cartões. Apresentaremos também nossos primeiros resultados com modelos de reconhecimentos de caracteres (OCR) para a leitura dos cartões, discutindo resultados obtidos com diferentes configurações de redes neurais. Terminaremos apresentando direções de trabalho futuro, como o uso de autoencoders.

Aprendizado de Máquina Científico: Redes Neurais na Modelagem de Dinâmicas Físicas
Vitor Balestro (UFF / IMPA)

Nesta palestra, abordaremos as chamadas Redes Neurais Informadas por Física (PINN). As PINNs são redes neurais treinadas para simular dinâmicas incorporando informações físicas em sua função de perda, e não (apenas) dados. Iniciaremos a apresentação com o conceito de redes neurais inspiradas pela física na sua forma original. A seguir, discorreremos sobre diversas aplicações, dentre as quais incluímos propagação de calor, propagação de ondas em meios heterogêneos, dinâmica dos fluidos e computação gráfica. Terminaremos a discussão com uma apresentação de novas arquiteturas em desenvolvimento no Centro Pi.

Organização

Laboratório Visgraf @ IMPA