Fandom

Students

LAPIS/Disciplinas/Processamento de Imagens:TransfMellin

< LAPIS | Disciplinas

1,330pages on
this wiki
Add New Page
Talk0 Share

Transformada de Mellin
Jeferson Jose de Miranda


Resumo Edit

Transformações bidimensionais, tais como a transformada de Mellin ou de Fourier têm aplicações em pré-processamento de imagens, filtragem e compressão. O trabalho aqui desenvolvido apresentará a transformada de Mellin, mostrando as propriedades permitem que as imagens sejam transformadas em versões invariáveis à escala, distorções (alterações verticais ou horizontais), translação e rotação.

Introdução Edit

[Belo, 2007] utiliza propriedades das transformadas de Fourier e Mellin como parte importante de um algoritmo de exploração visual de um robô, onde um procedimento baseado em transformações invariáveis a determinadas variações espaciais é usado para auxiliar o processo de guiar o robô por caminhos já conhecidos.

[Derrode e Ghorbel, 2001] usam a transformada de Fourier-Mellin (Fourier-Mellin Transform - FMT) para reconhecimento de padrões, reconstrução e recuperação em banco de dados com imagens em níveis de cinza. Esses autores afirmam que principal dificuldade prática da FMT reside na precisão e eficiência da sua aproximação numérica e, portanto, eles propõem em seu trabalho, três alternativas à extensão analítica da FMT (AFMT): a aproximação discreta (Discrete-Afmt), uma versão eficiente (Fast-Afmt) e a aproximação cartesiana.

A aproximação discreta consiste em uma reamostragem de uma imagem f(p,q) em coordenadas polares discretas. A versão eficiente da transformada utiliza um mapeamento log-polar com círculos exponencialmente espaçados e a transformada discreta de Fourier. A versão cartesiana consiste em modificar as equações das transformadas para aceitarem coordenadas cartesianas ao invés de polares.

A Transformada de Mellin ainda pode ser aplicada, em conjunto com outras funções, na realização de marca d'água digital (digital watermarking) tal como foi realizado no trabalho de [Oapos et. al., 1997]. Digital watermarking é uma técnica que permite adicionar informações de copyright ocultas em uma imagem digital. Já [De Sena e Rocchesco, 2004] utilizaram a transformada de Mellin para aplicação em efeitos sonoros digitais.

Transformações Integrais Invariáveis Edit

Um trabalho bastante completo sobre a transformada de Mellin e sua relação com a transformada de Fourier foi desenvolvido por [Bello, 2007]. Um dos objetivos de se trabalhar com a transformada de Mellin, e com combinações desta com a transformada de Fourier é a comparação de imagens que sofreram alterações a partir de uma imagem original. Essas comparações são possíveis graças à propriedade de invariância proporcionadas pela combinação das transformadas citadas com um mapeamento de coordenadas.

Transformada de Fourier Edit

Em uma dimensão, a Transforma de Fourier (Fourier Transform - FT) de uma função complexa f(x) e a sua inversa são definidas como:

F(k) = \int_{-\infty}^{+\infty} f(x)e^{-2\pi ikx}\,dx
e
f(k) = \int_{-\infty}^{+\infty} F(x)e^{-2\pi ikx}\,dx

A versão em duas dimensões, da transformade e da sua inversa, é dada por:

F(w_x,w_y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x,y)e^{-2\pi i (w_xx,w_yy)}\,dxdy
e
f(x,y) = \int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} F(w_x,w_y)e^{-2\pi i (k_xx,k_yy)}\,dw_xdw_y

Na forma discretizada (DFT) de uma função bidimensional f(x_k,y_k), tem-se, para as equações anteriores:

F(u,v) = \sum_{y_k=0}^{M-1} \sum_{x_k=0}^{N-1} f(x_k,y_k)e^{-2\pi (ux_k/N+vy_j/M)}
e
f(x_k,j_k) = 1/NM \sum_{v=0}^{M-1} \sum_{u=0}^{N-1} F(u,v)e^{2\pi (ux_k/N+vy_j/M)}

A transformada de Fourier (DFT) possui a propriedade de translação, onde duas imagens idênticas, porém transladadas, apresentam a mesma amplitude após a transformação de fourier, a propriedade da escala, onde variações em escala no domínio espacial causam variações inversas no domínio da frequência e a propriedade da rotação, que garante que rotações na função f são acompanhadas por rotações na magnitude da Transformada de Fourier.

Transformada de Mellin Edit

A Transformada de Mellin para uma função f(x) é dada por:

M(s) = \int_0^{+\infty} f(x)x^{s-1}\,dx

A partir desta definição se pode perceber que a Transformada de Fourier de f(exp\,\xi) é a Transformada de Mellin de M(i\omega) de f(x) ao longo do eixo imaginário do plano complexo. A prova matemática para esta afirmação, e todo o desenvolvimento matématico para a combinação das transformadas de Fourier (apresentada acima) e Mellin de forma a obter as invariâncias à translação, rotação, escala e dilatações horizontais ou verticais podem ser conferidas em [Belo, 2007].

Mapeamento Log-Polar e Log-Log Edit

A várias formas de combinação das transformadas de Fourier e de Mellin exigem uma transferência dos dados de entrada para um novo sistema de coordenadas, que pode ser o Log-Polar ou o Log-Log. As formas de conversão estão descritas em [Belo, 2007]. [Alan Peters II, 2007] realizou um trabalho que mostra formas de conversão do mapeamento Log-Polar a imagens digitais, dado que, a formulação matemática contínua não é trivialmente traduzida em uma forma discreta de dados de entrada. No trabalho de [Derrode e Ghorbel, 2001] ainda se encontram formas alternativas de realizar a tradução Log-Polar, bem como uma versão da transformada de Mellin que trabalha diretamente com coordendas cartesianas.

Aplicação Edit

Em [Mathworks.com] (vide refências) há uma implementação da transformada de Fourier-Mellin, que permite a comparação de imagens em nívens de cinza que comprova a invariancia de escala e rotação através da comparação entre duas imagens. A aplicação foi desenvolvida para Matlab.

Conclusões Edit

[Derrode e Ghorbel, 2001] mostraram que é possível recuperar uma imagem em níveis de cinza, com um certo grau de precisão e que é possível classificar objetos de forma confiável utilizando a transformada Fourier-Mellin. No trabalho de [Oapos et. al., 1997], a transformada de Fourier-Mellin foi usada como forma robusta de verificação de marca d'água digital. [De Sena e Rocchesco, 2004] apresentaram o uso da Transformada de Mellin para a elaboração de efeitos sonoros digitais, onde comumente a transformada de Fourier é utilizada. Daí conclui-se que, as aplicações da Transformada de Mellin são todas baseadas nas propriedades de invariância citadas nas referências apresentadas, e que a combinação com a transformada de Fourier possibilita várias formas de implementação, com diferentes níveis de precisão e eficiência da aplicação dessas invariâncias.

Referências Edit

[1] Alan Peters II, Richard. On the Computation of the Discrete Log-Polar Transform. 2007.
[2] Belo, Felipe Augusto W. Desenvolvimento de Algoritmos de Exploração e Mapeamento Visual para Robôs Móveis de Baixo Custo. 2006. Dissertação de Mestrado da Puc-Rio. OBS: seguir o seguinte caminho a partir do link: Biblioteca Digital → Conheça nossa Biblioteca → Consultas → Conteúdos e Ocorrências por Autor → Felipe Augusto Weilemann Belo – Fweilemann → Desenvolvimento de Algoritmos de Exploração e Mapeamento Visual Para Robôs Móveis de Baixo Custo.
[3] De Sena, Antonio. Rocchesco, Davide. A Fast Mellin Transform with Applications in DAFX. In: Proceedings of the 7th International Conference on Digital Audio Effects (DAFX'04). Naples, Italy, October 5-8, 2004.
[4] Derrode, Stéphane, Ghorbel, Faouzi. Robust and Efficient Fourier-Mellin Transform Approximations for Gray-Level Image Reconstruction and Complete Invariant Description. In: Computer Vision and Image Understanding: CVIU, 2001.
[5]Mathworks.com. Acesso em julho de 2007.
[6] Oapos. Ruanaidh, J. J. K. Pun, T. Rotation, scale and translation invariant digital imagewatermarking. In: Image Processing, 1997. Proceedings., International Conference on Volume 1, Issue , 26-29 Oct 1997 Page(s):536 - 539 vol.1.

Ad blocker interference detected!


Wikia is a free-to-use site that makes money from advertising. We have a modified experience for viewers using ad blockers

Wikia is not accessible if you’ve made further modifications. Remove the custom ad blocker rule(s) and the page will load as expected.