Avaliação do efeito da variação de dimensionalidade na seleção de realizações geoestatísticas representativas para quantificação de risco, usando o método de Análise de Componente Principal

Avaliação do efeito da variação de dimensionalidade na seleção de realizações geoestatísticas representativas para quantificação de risco, usando o método de Análise de Componente Principal

Resumo

by Henrique Hungari Rodrigues, Luís Otávio Mendes da Silva, Susana Margarida da Graça Santos, Denis José Schiozer, presented at IV Congresso Nacional de Engenharia de Petróleo, Gás Natural e Biocombustíveis, May 2021.

Resumo

 

A etapa de seleção de modelos representativos (MRs) para tomada de decisão sob incerteza tem, muitas vezes, um elevado custo computacional gasto em simulações de escoamento (Schiozer et al., 2019). Como forma de reduzir este custo, Mahjour et al. (2020) simplificaram as 300.000 dimensões das realizações geoestatísticas do modelo benchmark UNISIM-II-D em duas, utilizando redução de dimensionalidade. Contudo, tal simplificação tem como consequência a perda da variabilidade do conjunto de dados. Assim, esse trabalho utiliza Análise de Componente Principal (PCA, na sigla em inglês) para redução de dimensionalidade, variando o número de dimensões geradas para avaliar a quantidade de informação capturada no sistema simplificado, e buscar a melhor configuração do fluxo de trabalho para quantificação de risco. Foi observado que, para o caso estudado, as dimensões geradas pela PCA capturam pouca variabilidade e de forma heterogenia em relação às propriedades que as dimensões representam, como porosidade. Dessa forma, um sistema simplificado com poucas dimensões, além de pouca informação, fica enviesado. Em relação à quantificação de risco, independentemente do número de MRs e técnicas de clusterização, o aumento do número de dimensões geradas não só não favoreceu os resultados como aumentou os erros relacionados à representação do risco. Este fenômeno é explicado pela literatura como a “maldição da dimensionalidade”. Recomenda- se a aplicação do fluxo de trabalho usando poucas dimensões (entre 2 e 4), Kmeans como método de clusterização para seleção de MRs e o maior número de MRs possível.