SciELO - Scientific Electronic Library Online

 
vol.15 número3Control Difuso de Flujo de Fluidos en una Estación de LaboratorioEstabilidad de Pigmentos en Frutas Sometidas a Tratamiento con Energía de Microondas índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Información tecnológica

versión On-line ISSN 0718-0764

Inf. tecnol. v.15 n.3 La Serena  2004

http://dx.doi.org/10.4067/S0718-07642004000300008 

 

Información Tecnológica-Vol. 15 N° 3-2004, págs.: 53-60

LÓGICA DIFUSA Y REDES NEURONALES

Verificación de Firmas Usando Transformada de Gabor

Signature Verification using the Gabor Transform

 

C. Cruz, R. Reyes, M. Nakano y H.M. Pérez

Inst. Politécnico Nacional, Esc. Superior de Ingeniería Mecánica y Eléctrica, Sección de Estudios de Posgrado e Investigación, Unidad Culhuacan, Av. Santa Ana Nº 1000, Col. San Francisco Culhuacan, 04430 México, D.F.-México (e-mail: hmpm@prodigy.net.mx)


Resumen

Este artículo se propone un sistema de verificación estática de firmas con alta capacidad de detección de falsificaciones. En la etapa de extracción de características se obtienen los coeficientes de la transformada de Gabor en cada región de la firma, extrayéndose la posición del coeficiente sobresaliente de cada región. Estas proporcionan información local acerca de la frecuencia y orientación de la textura de una firma. Usando las características extraídas, el sistema entrena una red neuronal de retropropagación con una arquitectura de 9-9-2 para cada firmante. La eficiencia del sistema propuesto se evaluó usando 30 firmas auténticas y 20 firmas falsificadas por expertos para cada firmante. De los resultados obtenidos por simulación, se concluye que el sistema propuesto presenta una verificación global con 90% de acierto, con una menor complejidad computacional.


Abstract

This paper proposes an off-line signature verification system with fairly good detection capacity against expert forgeries. The feature extraction stage of the proposed system, estimates the coefficients of the Gabor Transform in each local region of the signature image, and extracts the positions of relevant coefficients. These provide local information about frequency and orientation of the signature image texture. Using the extracted features, the proposed system adapts a back-propagation multiplayer neural network with 9-9-2 architecture for each signer. The proposed system was evaluated using 30 genuine signatures and 20 expert forgeries for each signer. The computer simulation results show a 90% overall success, with a lower computational complexity.

Keywords: off-line signature verification, Gabor transform, neural networks, pattern recognition


 

INTRODUCCIÓN

La verificación de firmas es un tema investigado ampliamente debido a la gran importancia que tiene, básicamente, en el sistema financiero. Sin embargo, no existe todavía un método suficientemente confiable, especialmente en la detección de firmas falsificadas. Aquí, el problema principal que enfrenta la verificación de firmas es determinar si una firma es original o falsificada.

Existen dos clases de sistemas de verificación de firmas: Sistemas de verificación dinámica, en el cual el análisis de la firma se lleva acabo en el momento en que ésta se realiza, extrayéndose la información acerca de la velocidad, presión, inclinación, etc.. En estos sistemas la captura de la firma se realiza por medio de una tabla digitalizadora y una pluma electrónica (Lee et al., 1996). La segunda clase la forman sistemas de verificación estática, en donde la única información disponible se obtiene de una imagen de la firma digitalizada por medio de una fotografía o un escáner después de la realización de la misma.

En el proceso de evaluación del sistema se presentan dos tipos de errores, los cuales se clasifican como: Error tipo I y Error tipo II. El primero se presenta cuando el sistema reconoce una firma original como una falsificación, mientras que el segundo error que se presenta cuando el sistema considera una firma falsificada como una firma original.

Para crear una falsificación profesional es necesario conocer la firma original, ensayarla el tiempo que sea necesario para que esta sea muy parecida a la original, e incluso esta firma se puede calcar, mientras que una falsificación simple es aquella en donde solamente se conoce el nombre de la persona, realizando así una firma arbitraria la cual es poco probable que sea parecida a la original.

El sistema de verificación estático de firmas, que será analizado en este trabajo parte de una imagen capturada y de la extracción de características, que es un factor primordial e incluso básico, ya que el funcionamiento del sistema depende mucho de las características utilizadas para representar la firma.

Existen dos características fundamentales que se analizan en el proceso de análisis de imágenes: las características locales y las características globales. Las primeras son utilizadas generalmente para propósitos de verificación, y las segundas para propósitos de reconocimiento. Qi y Huant (1995), Baltzakis y Papamarkos (2001) y Kai y Hong (1997) propusieron un sistema de verificación usando características globales, tales como ancho, altura, centro de gravedad e inclinación de la firma. Bajas y Chaudhury (1997), y Toscano et al. (2000) extrajeron características globales tales como las envolventes de la firma e información sobre la distribución de los trazos de la firma para su reconocimiento. Sabourin et al. (1997) y Cruz et al. (2002) dividen la imagen de la firma en varias áreas pequeñas y extraen las características locales de la firma para su verificación. Sabourin et al. (1997) calculan el granulométrico en cada área local de la firma y se basan en esta característica para la verificación.

Las características empleadas en el sistema propuesto se extraen por medio de los coeficientes de la Transformada de Gabor, cuyas funciones básicas presentan una estrecha relación con el campo visual de seres humanos. A éste respecto varios experimentos biológicos mostraron que el sistema visual descompone una imagen retinal en varias imágenes filtradas y que cada una de ellas contienen variaciones de intensidad sobre un rango angosto de frecuencias y orientaciones (Tao y Kwan, 1999; Sabourin et al., 1997). La transformada de Gabor en 2-D es usada para el análisis y segmentación de imágenes, ya que esta se extrae pasando una ventana de información espectral local concerniente a la forma y textura sin sacrificar la información acerca de la localización en 2-D o relaciones es-paciales más globales, como la hace la transformada de Fourier (Daugman, 1988).

Debido a que las funciones básicas de Gabor no son ortogonales no existe un método directo para obtener los coeficientes de la expansión de Gabor. Así para obtener los coeficientes de Gabor de una manera sistemática para cualquier imagen arbitraria se tiene que utilizar algún algoritmo de adaptación tal como el algoritmo de Mínimos Cuadrados promedio (LMS) o el algoritmo Recursivo de Mínimos Cuadrados (RLS).

En este trabajo se propone un método de extracción de características usando la expansión de Gabor con funciones reales. Esta modificación se hace en virtud de que la función de Gabor es una función compleja y el cálculo de valores complejos requiere un mayor número de operaciones que el cálculo de variables reales. Para obtener los coeficientes de expansión de Gabor se usa una Red Neuronal del tipo Elemento Lineal Adaptable (ADALINE).

SISTEMA PROPUESTO

La figura 1 muestra un diagrama a bloques del sistema propuesto Dichos bloques serán descritos en las siguientes secciones.

Base de datos

El sistema consiste de una base de datos de 30 firmas de 5 firmantes diferentes, de las cuales 30 son originales, 20 falsificaciones profesionales y 20 falsificaciones simples para cada uno de los firmantes. Las firmas fueron escaneadas a una resolución de 200 dpi. en escala de grises de 8 bits en un espacio delimitado de 4x3.5 cm en papel blanco, elaboradas con una pluma de punto mediano de tinta negra. La Fig. 2 muestra la imagen de una firma original, una falsificación profesional, y una falsificación simple, las cuales se encuentran almacenadas en la base de datos.



Fig. 1: Diagrama a bloques del sistema de verificación de firmas propuesto.


(a)

(b)

(c)

Fig. 2: Ejemplo de una firma original (a), una falsificación profesional (b) y una falsificación simple (c).

Transformada de Gabor (GT) Real

Dada una imagen I(x,y), x=0,..,X-1, y=0,..,Y-1, normalizada en un rango de [-0.5, 0.5], se segmenta en 9x6 retinas, donde L=9 y K=6. Seguidamente de cada retina se obtienen MxN coeficientes donde M y N son variables ya que estas dependen del tamaño de la imagen, como se muestra en la figura 3.



Fig. 3: Segmentación de la imagen para la aplicación de la expansión de Gabor real.

La transformada de Gabor compleja para dicha imagen esta dada por (Tao y Kwan, 1999):

, (1)

donde representa la imagen recuperada o reconstruida, son los coeficientes de la GT compleja. denota las funciones de Gabor que contienen ondas senoidales y cosenoidales moduladas por una ventana Gausiana.

Esto es:

 
, (2)

donde x0 =n*N+(N-l)/2 y y0 =m*M+(M-l)/2, son las coordenadas del centro de la ventana Gausiana. Aquí, las funciones y los coeficientes son complejos. Para valores fijos de M y N, la selección del factor a determina la cantidad de traslape efectivo de la función básica de Gabor.

Para reducir la complejidad computacional de los coeficientes de la GT, se puede emplear la Transformada de Gabor real la cual esta dada por la ecuación (3).

, (3)

donde las funciones básicas de Gabor están dadas por:

 
 
(4)

En este caso tanto las funciones de Gabor como los coeficientes de la expansión son reales.

El algoritmo LMS usado para extraer los coeficientes de la GT real consiste en encontrar la minimización de la función de error Emn en la retina (m,n).

, (5)

donde es la representación de la GT en la retina (m,n), por lo tanto

, (6)

y la ecuación (3) puede reescribirse como:

, (7)

Suponiendo que la ventana Gausiana es truncada fuera de cada retina, entonces la ecuación (7) es:

(8)

Tomando y como vectores

 
, (9)


(10)

Dentro de cada retina (m,n) la ecuación (8) puede reescribirse como:

, (11)

El valor optimo de los coeficientes de la GT real para cada retina pueden ser obtenidas independientemente minimizando el MSE local.

 
. (12)

Se requiere minimizar la ecuación (12) ya que se tiene que resolver un sistema de MxN ecuaciones con MxN incógnitas, lo cual puede requerir un considerable esfuerzo computacional, aun para moderados valores de M y N. Es por eso que utiliza una Red Neuronal ADALINE para resolver este problema, cuya estructura se muestra en la figura 4.

La figura 4 muestra la adaptación del bloque (m,n) de la imagen, donde es la imagen reconstruida e es la imagen original. Los patrones de entrada a la red en el bloque (m,n) están dados por la ecuación (9) evaluada en todos los pixeles (x,y) del bloque, y los coeficientes de la red están dados por la ecuación (10).



Fig. 4: Estructura de la red ADALINE empleada en la adaptación en el bloque (m,n).

Una vez que la red converge y se obtienen los coeficientes de cada retina (en este caso los pesos de la red ADALINE) Anm, estos proporcionan una representación óptima de la imagen dentro del bloque (m,n) en el sentido de mínimos cuadrados. Esta operación se itera para todos los bloques (KxL bloques) de la imagen de la firma.

Extracción de característica

La figura 5 muestra la gráfica de la distribución de intensidad de los coeficientes de Gabor en frecuencia y orientación para una sola retina de la imagen, en esta gráfica se puede observar que la mayoría de estos valores son muy pequeños o aproximadamente igual a cero, es por eso que solo se tomo la posición del valor de intensidad máxima en cada retina. Una vez que se localizó la posición de la intensidad máxima de los coeficientes en una retina, esta posición así como los valores de M y N se normalizaron de acuerdo a la ecuación (13) debido a que estos dependen del tamaño original de la imagen.

. (13)

donde x es la posición horizontal donde se encuentra el coeficiente de mayor intensidad dentro de una retina (n,m). y es la posición vertical donde se encuentra el coeficiente de mayor intensidad dentro de una retina (n,m). N es el número de pixeles horizontales de una retina (n,m). M es el número de pixeles verticales de una retina (n,m).


Fig. 5: Coeficientes de Gabor para una retina (m,n).

El resultado de esta normalización es un vector de [1,(KxL)]. El vector resultante de la normalización se comparó con vectores iguales para diferentes firmas de la misma persona, esto con el propósito de observar cuales son las retinas características de una firma, en otras palabras, se pretende determinar, cuales retinas determinan las rasgos particulares de cada firmante. El proceso se aplica a las firmas originales y a las falsificadas.

De la comparación de los vectores normalizados, se llega a la conclusión de que el tamaño de los vectores característicos, es decir los vectores que se utilizarán como patrones de entrenamiento y prueba de la red neuronal es de longitud 8, para determinar este valor se obtuvo un promedio de la cantidad de puntos que coincidían en cada firmante, por ejemplo, el firmante 4 y 5 tienen menos puntos en común que los firmantes 1, 2 y 3, esto debido en gran medida en la complejidad de la firma.

Es importante mencionar que la comparación de los vectores normalizados se realizó solamente con falsificaciones profesionales, debido a que en México la mayoría de las personas no emplean su nombre para firmar, ya que en la mayoría de los casos las firmas aparecen como caracteres especiales o adornos, lo cual hace a la firma una imagen no entendible para las personas, en comparación con otros países donde si recurren a su nombre para firmar, con esto, se reduce en gran medida la posibilidad de que una falsificación simple por sus características se asemeje a una firma original.

En la figura 6 se puede observar que para cada uno de los firmantes existen retinas características que los diferencian entre sí. Las líneas marcadas con asteriscos son los vectores de las firmas falsificadas y las líneas continuas son los vectores de las firmas originales para 3 diferentes firmantes, con lo cual se puede observar la diferencia entre ellas. Estos vectores característicos tienen una longitud de 8 y son empleados para los patrones de entrenamiento y de prueba de la red neuronal de retropropagación con el propósito de identificar si la firma es original o falsificada.



(a)

(b)

(c)


Fig. 6: Comparación de los vectores característicos entre firmas originales y falsificadas del mismo firmante; (a)firmante A, (b) firmante B, (c) firmante C.

EVALUACION DEL SISTEMA

Se emplea una red de retropropagación de arquitectura 9-9-2 (figura 7), una para cada firmante es decir 5 redes neuronales en total, esto con el propósito de que si se incluye un firmante más a la base de datos no sea necesario reentrenar las redes neuronales.



Fig. 7: Arquitectura de la red neuronal de re-tropropagación.

Para el campo de patrones de entrenamiento de la red se utilizaron 20 firmas originales y 15 falsificaciones profesionales, para el campo de prueba se emplearon 10 firmas originales y 5 falsificaciones profesionales. Debido a las características de una falsificación simple es muy remota la posibilidad de que el sistema pueda aceptar una falsificación simple como una firma original, por tal motivo las falsificaciones simples no se incluyen en los campos de entrenamiento y de prueba.

RESULTADOS Y DISCUSIÓN

Los resultados anteriores se obtuvieron empleando el sistema propuesto para cada firmante, obteniéndose porcentajes de error tipo I, error tipo II, así como porcentajes de verificación global para cada firmante. Cabe men-cionar que el porcentaje de verificación global para los patrones de entrenamiento fue del 100%.

La figura 8 muestra los porcentajes de error tipo I que se obtuvieron para los patrones de prueba para todos los firmantes.

La figura 9 muestra los porcentajes de error tipo II que se obtuvieron de los patrones de prueba para todos los firmantes. La figura 10 muestra el porcentaje de verificación total de cada uno de los firmantes.



Fig. 8: Porcentaje de error tipo I para todos los firmantes.



Fig. 9: Porcentaje de error tipo II para todos los firmantes.



Fig. 10: Porcentaje global de verificación para todos los firmantes.

De acuerdo a los resultados anteriores el sistema propuesto presenta un porcentaje total de error tipo I del 12%, un porcentaje total de error tipo II de 8% y un porcentaje de verificación global del 90%. De acuerdo a lo que han reportado otros autores (Sabourin et al., 1997) los sistemas de verificación tratan de disminuir el error tipo II, debido a este error causa mayores pérdidas en el sistema financiero. Observando la figura 8 se ve claramente que para un valor de a =0.05, se logra este propósito en gran medida.

La tabla 1 muestra el porcentaje de error tipo II y el tipo I del sistema propuesto junto con los porcentajes de los sistemas de verificación de firmas reportados en la literatura (Justino et al., 2002; Baltzakis y Papamarkos, 2001; Cordella et al., 1999; Kai y Hong, 1997; Qi y Huant, 1995). Aquí el tipo de falsificación considerado es solamente la falsificación profesional, debido a que todos los sistemas detectan correctamente falsificación simple o aleatoria. Los artículos que no presentan datos acerca de la falsificación profesional no se incluyeron en la tabla.

Como se puede observar en la tabla 1, el sistema propuesto presenta mejores resultados que los sistemas reportados en la literatura con respecto al error tipo II, el cual causa realmente una pérdida importante al sistema financiero. Aunque, el porcentaje de error tipo I del sistema propuesto es mayor que el de otros sistemas, sin embargo, en este caso el firmante puede repetir su firma para realizar su operación.


Tabla 1: Comparación del funcionamiento del sistema propuesto.

Sistemas

Error Tipo II

Error Tipo I

Sistema Propuesto

8%

12%

Justino et al. (2002)

22.7%

2.8%

Baltzakis y Papamorkos (2001)

9.8%

3 %

Cordella et al.(1999)

19.8%

1.2%

Kai y Hong (1997)

11.8%

11.2%

Qi y Hunt (1995)

9.3%

4%

CONCLUSIONES

El sistema de verificación estático de una firma escrita a mano se lleva a cabo extrayendo las características de la imagen por medio de los coeficientes de Gabor, los cuales entregan una amplia información de la imagen, lo que permite determinar las intensidades locales de las imágenes las cuales son aplicadas como las características intrínsecas de cada firmante para poder determinar la autenticidad de la firma.

Cabe mencionar que el sistema propuesto basado en la extracción de características de la imagen, por medio de los coeficientes de la Transformada de Gabor, no ha sido empleado antes con el propósito de verificación estática de firmas, ya por lo general la Transformada de Gabor se aplica para el análisis de textura de imágenes.

AGRADECIMIENTOS

Se agradece al Consejo Nacional de Ciencia y Tecnología de México por el financiamiento brindado para la realización de esta investigación.

REFERENCIAS

Bajas R. y S. Chaudhury, Signatura Verification Using Multiple Neural Classifiers, Pattern Recognition: 20 (1), 1-7 (1997).        [ Links ]

Baltzakis H. y N. Papamarkos, A new signature verification technique base don a twostage neural network classifier, Engineering Applications of Artificial Intelligence: 14, 95-103 (2001).        [ Links ]

Cordella L., P. Foggia, C. Sansone y M. Vento, Documento Validation by Signatura: a Serial Multi-Expert Approach, proa. Of the 5th Int. Conf. On Document Análisis and Recognition: 601-604 (1999).        [ Links ]

Cruz C., R. Reyes, M. Nakano y H. Meana, Reconocimiento Estático de Firmas por Extracción de Características Empleando la Transformada de Gabor, Memoria técnica del CONIELECOMP 2002: 20-24 (2002).        [ Links ]

Daugman J.C., Complete Discrete 2-D Gabor Transforms by Neural Networks for Image Analysis and Compression,IEEE Transactions on Acoustics: 36 (7), 751-761 (1998).        [ Links ]

Justino E., F. Bortolozzi y R. Sabourin, The Interpersonal Intrapersonal Variability Influen-ces on Off-Line Signature Verification Using HMM, Proc. of the XV Brazilian Symposium on Computer Graphics and Image Proces-sing,197-202 (2002).        [ Links ]

Kai H. y Y. Hong, Off-line Signature Verifica-tion Based on Geometric Feature Extraction and Neural Network Classification, Pattern Recognition: 30 (1), 9-17 (1997).        [ Links ]

Lee L., T. Berger y E. Aviczer, Reliable On-Line Human Signature Verification Systems, IEEE Transactions on Pattern analysis and Machine Intelligence:18 (6),643-647 (1996).        [ Links ]

Qi Y, B. Hunt,A multiresolution Approach to Computer Verification of Handwritten Signatu-re, IEEE Transaction on Image Processing: 4 (6), 870-874 (1995).        [ Links ]

Sabourin R., G. Ginette y J. Francoise,Off-line Signature Verification by Local Granulometric Size Distributions, IEEE Transactions on Pattern Analysis and Machine Intelligence: 19 (9), 976-978 (1997).        [ Links ]

Tao L. y H. Kwan, 2-D Real Gabor Transform, Proceedings of the 1999 IEEE Canadian conference on Electrical and Computer Enginee-ring: 831-834 (1999).        [ Links ]

Toscano K., G. Sánchez, M. Nakano y H. Pérez, Off-line Signature Recognition and Verification Using Multiplr Growing Cell Neural Network Structure, Revista Científica: 6(4), 175-184 (2000).        [ Links ]