Fandom

Students

LAPIS/Disciplinas/Processamento de Imagens:TransfMellin

< LAPIS | Disciplinas

1,331pages on
this wiki
Add New Page
Talk0 Share

Ad blocker interference detected!


Wikia is a free-to-use site that makes money from advertising. We have a modified experience for viewers using ad blockers

Wikia is not accessible if you’ve made further modifications. Remove the custom ad blocker rule(s) and the page will load as expected.

Transformada de Mellin
Jeferson Jose de Miranda


Resumo Edit

Transformações bidimensionais, tais como a transformada de Mellin ou de Fourier têm aplicações em pré-processamento de imagens, filtragem e compressão. O trabalho aqui desenvolvido apresentará a transformada de Mellin, mostrando as propriedades permitem que as imagens sejam transformadas em versões invariáveis à escala, distorções (alterações verticais ou horizontais), translação e rotação.

Introdução Edit

[Belo, 2007] utiliza propriedades das transformadas de Fourier e Mellin como parte importante de um algoritmo de exploração visual de um robô, onde um procedimento baseado em transformações invariáveis a determinadas variações espaciais é usado para auxiliar o processo de guiar o robô por caminhos já conhecidos.

[Derrode e Ghorbel, 2001] usam a transformada de Fourier-Mellin (Fourier-Mellin Transform - FMT) para reconhecimento de padrões, reconstrução e recuperação em banco de dados com imagens em níveis de cinza. Esses autores afirmam que principal dificuldade prática da FMT reside na precisão e eficiência da sua aproximação numérica e, portanto, eles propõem em seu trabalho, três alternativas à extensão analítica da FMT (AFMT): a aproximação discreta (Discrete-Afmt), uma versão eficiente (Fast-Afmt) e a aproximação cartesiana.

A aproximação discreta consiste em uma reamostragem de uma imagem f(p,q) em coordenadas polares discretas. A versão eficiente da transformada utiliza um mapeamento log-polar com círculos exponencialmente espaçados e a transformada discreta de Fourier. A versão cartesiana consiste em modificar as equações das transformadas para aceitarem coordenadas cartesianas ao invés de polares.

A Transformada de Mellin ainda pode ser aplicada, em conjunto com outras funções, na realização de marca d'água digital (digital watermarking) tal como foi realizado no trabalho de [Oapos et. al., 1997]. Digital watermarking é uma técnica que permite adicionar informações de copyright ocultas em uma imagem digital. Já [De Sena e Rocchesco, 2004] utilizaram a transformada de Mellin para aplicação em efeitos sonoros digitais.

Transformações Integrais Invariáveis Edit

Um trabalho bastante completo sobre a transformada de Mellin e sua relação com a transformada de Fourier foi desenvolvido por [Bello, 2007]. Um dos objetivos de se trabalhar com a transformada de Mellin, e com combinações desta com a transformada de Fourier é a comparação de imagens que sofreram alterações a partir de uma imagem original. Essas comparações são possíveis graças à propriedade de invariância proporcionadas pela combinação das transformadas citadas com um mapeamento de coordenadas.

Transformada de Fourier Edit

Em uma dimensão, a Transforma de Fourier (Fourier Transform - FT) de uma função complexa f(x) e a sua inversa são definidas como:

F(k) = \int_{-\infty}^{+\infty} f(x)e^{-2\pi ikx}\,dx
e
f(k) = \int_{-\infty}^{+\infty} F(x)e^{-2\pi ikx}\,dx

A versão em duas dimensões, da transformade e da sua inversa, é dada por:

F(w_x,w_y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x,y)e^{-2\pi i (w_xx,w_yy)}\,dxdy
e
f(x,y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} F(w_x,w_y)e^{-2\pi i (k_xx,k_yy)}\,dw_xdw_y

Na forma discretizada (DFT) de uma função bidimensional f(x_k,y_k), tem-se, para as equações anteriores:

F(u,v) = \sum_{y_k=0}^{M-1} \sum_{x_k=0}^{N-1} f(x_k,y_k)e^{-2\pi (ux_k/N+vy_j/M)}
e
f(x_k,j_k) = 1/NM \sum_{v=0}^{M-1} \sum_{u=0}^{N-1} F(u,v)e^{2\pi (ux_k/N+vy_j/M)}

A transformada de Fourier (DFT) possui a propriedade de translação, onde duas imagens idênticas, porém transladadas, apresentam a mesma amplitude após a transformação de fourier, a propriedade da escala, onde variações em escala no domínio espacial causam variações inversas no domínio da frequência e a propriedade da rotação, que garante que rotações na função f são acompanhadas por rotações na magnitude da Transformada de Fourier.

Transformada de Mellin Edit

A Transformada de Mellin para uma função f(x) é dada por:

M(s) = \int_0^{+\infty} f(x)x^{s-1}\,dx

A partir desta definição se pode perceber que a Transformada de Fourier de f(exp\,\xi) é a Transformada de Mellin de M(i\omega) de f(x) ao longo do eixo imaginário do plano complexo. A prova matemática para esta afirmação, e todo o desenvolvimento matématico para a combinação das transformadas de Fourier (apresentada acima) e Mellin de forma a obter as invariâncias à translação, rotação, escala e dilatações horizontais ou verticais podem ser conferidas em [Belo, 2007].

Mapeamento Log-Polar e Log-Log Edit

A várias formas de combinação das transformadas de Fourier e de Mellin exigem uma transferência dos dados de entrada para um novo sistema de coordenadas, que pode ser o Log-Polar ou o Log-Log. As formas de conversão estão descritas em [Belo, 2007]. [Alan Peters II, 2007] realizou um trabalho que mostra formas de conversão do mapeamento Log-Polar a imagens digitais, dado que, a formulação matemática contínua não é trivialmente traduzida em uma forma discreta de dados de entrada. No trabalho de [Derrode e Ghorbel, 2001] ainda se encontram formas alternativas de realizar a tradução Log-Polar, bem como uma versão da transformada de Mellin que trabalha diretamente com coordendas cartesianas.

Aplicação Edit

Em [Mathworks.com] (vide refências) há uma implementação da transformada de Fourier-Mellin, que permite a comparação de imagens em nívens de cinza que comprova a invariancia de escala e rotação através da comparação entre duas imagens. A aplicação foi desenvolvida para Matlab.

Conclusões Edit

[Derrode e Ghorbel, 2001] mostraram que é possível recuperar uma imagem em níveis de cinza, com um certo grau de precisão e que é possível classificar objetos de forma confiável utilizando a transformada Fourier-Mellin. No trabalho de [Oapos et. al., 1997], a transformada de Fourier-Mellin foi usada como forma robusta de verificação de marca d'água digital. [De Sena e Rocchesco, 2004] apresentaram o uso da Transformada de Mellin para a elaboração de efeitos sonoros digitais, onde comumente a transformada de Fourier é utilizada. Daí conclui-se que, as aplicações da Transformada de Mellin são todas baseadas nas propriedades de invariância citadas nas referências apresentadas, e que a combinação com a transformada de Fourier possibilita várias formas de implementação, com diferentes níveis de precisão e eficiência da aplicação dessas invariâncias.

Referências Edit

[1] Alan Peters II, Richard. On the Computation of the Discrete Log-Polar Transform. 2007.
[2] Belo, Felipe Augusto W. Desenvolvimento de Algoritmos de Exploração e Mapeamento Visual para Robôs Móveis de Baixo Custo. 2006. Dissertação de Mestrado da Puc-Rio. OBS: seguir o seguinte caminho a partir do link: Biblioteca Digital → Conheça nossa Biblioteca → Consultas → Conteúdos e Ocorrências por Autor → Felipe Augusto Weilemann Belo – Fweilemann → Desenvolvimento de Algoritmos de Exploração e Mapeamento Visual Para Robôs Móveis de Baixo Custo.
[3] De Sena, Antonio. Rocchesco, Davide. A Fast Mellin Transform with Applications in DAFX. In: Proceedings of the 7th International Conference on Digital Audio Effects (DAFX'04). Naples, Italy, October 5-8, 2004.
[4] Derrode, Stéphane, Ghorbel, Faouzi. Robust and Efficient Fourier-Mellin Transform Approximations for Gray-Level Image Reconstruction and Complete Invariant Description. In: Computer Vision and Image Understanding: CVIU, 2001.
[5]Mathworks.com. Acesso em julho de 2007.
[6] Oapos. Ruanaidh, J. J. K. Pun, T. Rotation, scale and translation invariant digital imagewatermarking. In: Image Processing, 1997. Proceedings., International Conference on Volume 1, Issue , 26-29 Oct 1997 Page(s):536 - 539 vol.1.

Also on Fandom

Random Wiki