ISSN 0718-3291 Versión Impresa

ISSN 0718-3305 Versión en línea

Volumen 21 N° 3, Septiembre - Diciembre 2013

pdf Índice

Modelo para la representación de redes y búsqueda de caminos óptimos en Sistemas de Información Geográfica

Rafael Rodríguez-Puente1 Manuel S. Lazo-Cortés1

 

1Departamento de Técnicas de Programación. Facultad 3. Universidad de las Ciencias Informáticas. Carretera a San Antonio de los Baños km 2 VV, Torrens, Boyeros, La Habana, Cuba. E-mail: rafaelrp@uci.cu; mlazo@uci.cu


RESUMEN

Una de las funcionalidades presente en los sistemas de información geográfica es la búsqueda de caminos óptimos. En la actualidad, este tipo de funcionalidad se implementa sobre modelos que no garantizan escalabilidad y eficiencia cuando las redes son grandes.

En este artículo se propone un modelo de representación de redes en Sistemas de Información Geográfica basado en el concepto de grafos reducidos. Este modelo permite realizar búsquedas de caminos óptimos en redes grandes de forma eficiente y escalable. Una característica relevante del modelo propuesto es la posibilidad de realizar análisis a escala en la red.

Palabras clave: Representación de redes, sistemas de información geográfica, análisis de redes, búsqueda de caminos óptimos, reducción de grafos.


ABSTRACT

One of the features of Geographic Information Systems is related to optimal paths searches. This kind of functionality is implemented on models that do not guarantee scalability and efficiency when networks are large.

This article proposes a model for network representation in Geographic Information Systems. It is based on the concept of reduced graph. This model allows efficient and scalable optimal path searches in large networks. A relevant feature of the proposed model is the capability to perform scale analysis on the network.

Keywords: Network representation, Geographic Information Systems, network analysis, optimal path search, graph reduction.


INTRODUCCIÓN

Desde un punto de vista práctico un Sistema de Información Geográfica (SIG) es un sistema informático capaz de gestionar datos geográficos georreferenciados. Por georreferenciados se entiende que estos datos tienen asociadas coordenadas geográficas (longitud, latitud). También deben facilitar la relación de datos de diversa índole (densidad de población, información financiera, etc.) con datos geográficos.

Un SIG está formado por cuatro componentes: hardware, software, datos y recursos humanos [1].

Como parte de los datos los mapas tienen vital importancia. De forma intuitiva se puede decir que un mapa es un modelo que representa el "mundo real" y se almacena utilizando varios formatos, por ejemplo: Shape [2], TAB [3], entre otros. Por otra parte, existen proyectos que utilizan el modelo relacional extendido con soporte de tipos de datos espaciales (punto, línea, polígono, etc.) para almacenar los mapas; tal es el caso del proyecto OpenStreetMap [4].

Existen dos tipos de datos en el ámbito de los SIG: el vectorial y el raster. En el primer caso se utilizan puntos, líneas (definidas por una serie de puntos) y polígonos (delimitados por líneas) para representar los objetos geográficos. En el segundo caso los datos consisten en filas de celdas; a cada celda se pueden asociar datos de diversos tipos (medida, nombre, etc.) [5].

Para realizar análisis de redes se utilizan los SIG vectoriales, o sea, aquellos que usan el tipo de datos vectorial para representar la información geográfica; por lo que en el marco de este trabajo solo se hará referencia a este tipo de sistema.

Varios SIG cuentan con funcionalidades para el análisis de redes; entre estas se pueden mencionar las siguientes:

• ¿Cuál es el camino óptimo entre x e y?
• ¿Cuál es el camino de costo mínimo entre x e y según un determinado criterio?
• ¿Cómo llegar desde el lugar x al y pasando por los lugares x1, x2, ... xn?

Para responder este tipo de preguntas existen varios modelos de representación de redes en un SIG. Entre ellos los más relevantes son: el modelo relacional extendido y sistemas de archivos propios de determinadas herramientas informáticas. Por otra parte, cuando se habla de análisis de redes en SIG, no se pueden dejar de mencionar los grandes proveedores de servicios como Google, Microsoft, etc.; a pesar de que los mismos no publican los detalles de los mecanismos de almacenamiento y análisis que utilizan para brindar este tipo de funcionalidad.

Entre los sistemas que utilizan el modelo relacional extendido para la búsqueda de caminos óptimos se puede mencionar a pgRouting [6]. Este software es una extensión del Sistema Gestor de Bases de Datos (SGBD) objeto-relacional PostgreSQL, lo que permite utilizar las potencialidades que brinda dicho SGBD; entre las cuales destaca el sistema de almacenamiento y el de consultas. A pesar de lo anterior, el sistema presenta las siguientes deficiencias:

• Utiliza un modelo de grafo demasiado simple y poco escalable [7].
• Se recomienda su uso cuando las redes modeladas en la cartografía son de tamaño pequeño o mediano [7].
• Presenta problemas en la búsqueda de caminos cuando el origen o el destino no coinciden con una intersección de calles [8].

Estas deficiencias se deben, en gran medida, a que la representación interna de las distintas redes presentes en un mapa, haciendo uso del modelo relacional extendido, es ineficiente [9]. Esto se sustenta en el hecho de que las operaciones definidas sobre los grafos (grado, adyacentes, etc.) no están definidas sobre el modelo relacional, por lo que su implementación haciendo uso de este modelo trae consigo la realización de operaciones adicionales; aumentando su complejidad. Además, en [10] se plantea que cuando el modelado de un dominio específico de la realidad (modelo lógico) responde a una estructura de grafo, utilizar una base de datos de grafo es la alternativa lógica para almacenar los datos. En [11] se muestran los resultados experimentales de la realización de recorridos en datos que, por su naturaleza, son representados haciendo uso de grafos dirigidos acíclicos. Los recorridos fueron realizados sobre el SGBD MySQL y el motor de persistencia de grafos Neo4j. Los resultados muestran de forma general que los recorridos realizados en Neo4j son más eficientes que en la base de datos relacional.

Por otra parte, existen varios sistemas que tienen una implementación propia para el almacenamiento de los mapas, destacándose entre ellos el líder ArcGIS con el formato Shape. Esta herramienta brinda la posibilidad de definir una jerarquía de calles, de forma tal que la búsqueda de caminos óptimos se realiza priorizando las calles de mayor nivel en la jerarquía cuando la red de viales es grande. La jerarquía se utiliza para disminuir el tiempo de respuesta al usuario, lo cual introduce un error en el camino obtenido según la descripción en la ayuda del propio sistema. Este sistema también brinda la posibilidad de realizar el análisis obviando la jerarquía mencionada, lo que implica un menor rendimiento.

La interpretación del concepto "grande" que se hace en este trabajo es relativa y no se basa en un número particular de elementos presentes en una red. Este concepto puede depender de factores como características del hardware disponible, capacidad para la interpretación de características presentes en una red, entre otros.

El sistema gvSIG cuenta con un módulo de análisis de redes que provee diversas funcionalidades, facilitando la corrección de la topología, la creación de un grafo que representa una red de viales, así como la búsqueda de caminos óptimos. Este módulo de análisis de redes hace uso de los algoritmos clásicos de búsqueda de caminos óptimos, como el algoritmo de Dijkstra [12] y el A* [13]. El algoritmo de Dijkstra no es escalable respecto del tamaño del grafo y el A* no garantiza la obtención del óptimo en todos los casos.

El sistema Geographic Resources Analysis Support System (GRASS) es un SIG que se utiliza para manipulación de datos, procesamiento de imágenes, producción de gráficos y visualización de datos. GRASS utiliza la biblioteca Directed Graph Library [14] liberada bajo la licencia GPL para realizar análisis de redes. La idea original del proyecto se basa en el desarrollo de una biblioteca, que soporte el análisis sobre grafos de mediano tamaño en memoria de acceso aleatorio (RAM), haciendo uso de una estructura estática [15]; por lo que no es conveniente utilizarla cuando los grafos son grandes.

IDELabRoute es una biblioteca genérica para realizar análisis de redes con gestión dinámica de memoria, que surge porque en la práctica varios problemas necesitan tratar con redes de grandes dimensiones. Esta biblioteca permite realizar análisis de redes utilizando diversas fuentes de datos. De forma general, en IDELabRoute se propone hacer un uso racional de la RAM (mayor escalabilidad) a cambio de un decremento de la eficiencia en la búsqueda de caminos óptimos. Debido a esta razón no se considera conveniente usar este resultado cuando los grafos sobre los que se realizan análisis son grandes y es necesario mantener la eficiencia en la búsqueda de caminos óptimos.

La teoría de grafos provee una representación adecuada de una red, así como conceptos y algoritmos que permiten estudiar las propiedades de las mismas [16]. Por otra parte, en [17] se afirma que una red puede ser representada con la misma estructura de datos que es utilizada para la representación de grafos, por lo que son aplicables los algoritmos definidos para estos últimos. También se define una red como un conjunto de nodos y un conjunto de relaciones entre ellos [18], definición que está acorde con el concepto de grafo.

Luego del estudio de los modelos más utilizados para realizar análisis de rutas en SIG y teniendo en cuenta las definiciones de red y de grafo, se puede afirmar que es conveniente estudiar una red haciendo uso del concepto de grafo.

En el ámbito del uso de los grafos en la búsqueda de caminos óptimos, se han realizado varios trabajos para disminuir el tiempo de respuesta ante este tipo de petición en redes grandes haciendo uso de algoritmos heurísticos. Se han diseñado varias heurísticas y diversos algoritmos para resolver esta problemática [19-22]. Sin embargo, con la introducción de las heurísticas se introduce un error en el resultado; por lo que se puede afirmar que estos algoritmos no garantizan la obtención del camino óptimo en todos los casos.

Teniendo en cuenta el análisis realizado se plantea como objetivo de esta investigación: diseñar un modelo basado en grafos reducidos para representar redes en SIG, como punto de partida para la realización de búsquedas de caminos óptimos de forma eficiente y escalable.

El artículo se organiza de la siguiente forma: primero se presenta el modelo propuesto; luego se describen los componentes del mismo, así como las relaciones entre estos; después se muestran resultados experimentales y por último se presentan las conclusiones.

MODELO PARA LA REPRESENTACIÓN DE REDES EN SISTEMAS DE INFORMACIÓN GEOGRÁFICA

Existe una amplia variedad de definiciones de modelo. A pesar de sus diferencias, todas las definiciones tienen en común que un modelo es una representación teórica o gráfica de un fenómeno; en el mismo se trata de especificar los elementos fundamentales que caracterizan el fenómeno así como las relaciones entre estos.

En el marco de este trabajo se utilizará la definición de François E. Cellier, que expone que un modelo (M) para un sistema (S) y un experimento (E) es cualquier cosa a la cual se le puede aplicar E para responder preguntas sobre S [23].

En la Figura 1 se muestra un esquema con los componentes del modelo propuesto para la representación de redes viales. A continuación, se expone en detalle cada uno de los componentes de este modelo, así como las relaciones existentes entre los mismos.


F
igura 1. Modelo de representación de redes de viales.

Representación de una red mediante un grafo
Para representar una red mediante un grafo se parte de una capa vectorial que represente dicha red. En primer lugar, se propone el uso de un algoritmo que obtenga las intersecciones entre cada par de líneas de la red, para ello se puede utilizar el algoritmo FINDINTERSECTIONS presentado en [24]. Esta variante de solución tiene complejidad temporal O(n log n + I log n), donde n es la cantidad de segmentos e I la cantidad de intersecciones entre todos los segmentos.

Este algoritmo tiene como salida el conjunto de intersecciones entre todas las líneas que recibe como parámetro, así como las líneas relacionadas con cada intersección. A partir de estos datos se puede crear un grafo haciendo uso del Algoritmo 1.


Para la determinación de las aristas (paso 3 del Algoritmo 1) se utiliza el Algoritmo 2. En el mismo se debe tener en cuenta que una arista está conformada por cuatro valores: vértice de origen, vértice de destino, costo de la arista (puede ser un vector de valores que represente distintos tipos de costo) y su geometría. Como esta arista modela una parte de una red existente en el mundo real, es importante tener acceso a su geometría. Esto puede ser útil si en un futuro se desean obtener imágenes relacionadas con análisis realizados sobre el grafo; por ejemplo, para dibujar en un mapa el camino mínimo buscado sobre una determinada red. La función Costo permitirá obtener el costo asociado a una arista en dependencia de la información disponible de la red.

ALGORITMO DE REDUCCIÓN DE GRAFOS

En este epígrafe se presentan definiciones, notaciones y algoritmos relacionados con el proceso de reducción de grafos propuesto como parte del modelo.

Una regla de reescritura de grafos es un formalismo utilizado para transformar un grafo en otro siguiendo determinados principios. En el marco de este trabajo se utilizan las reglas de reescritura para garantizar que el proceso de reducción sea reversible y por tanto, que no exista pérdida de información.

A continuación se introducen las definiciones de regla de reescritura de grafos, grafo reducido, grafo reducido a partir de un grafo y vértice interior y exterior; las cuales pertenecen a los autores del presente trabajo.

Definición 1. Una regla de reescritura de grafos sobre un grafo G = (V, E, ƒC) es un cuádruplo de la forma (G1-, Gj-, ?in, ?out), donde:

• Gi = ({Vi},{}) es un grafo, donde Vi V.
• Gj = (Vj, Ej) es un grafo.
• ?in, ?out son dos conjuntos, cuyos elementos son cuádruplos de la forma (vm, c1, c2, vn), donde c1 c2 R+; vm vj; vn (V-{v¡}).

Para que un cuádruplo (vm, c1, c2, vn) pertenezca a ?in se debe cumplir que exista la arista (vn, Vi) en el grafo G (sobre el cual se define la regla de reescritura); además, el costo de dicha arista debe ser c1. Luego de aplicar la regla de reescritura, se obtiene el grafo G1 = (V1, E1, ƒc1) y se cumple que la arista (Vn, Vm) pertenece al nuevo grafo, y el costo de la misma es c2. Análogamente se define ?out, con la única diferencia de la orientación de las aristas.

Definición 2. Un grafo reducido es un cuádruplo Gr = (Vr, Er, ƒ, R), donde:

• Vr es un conjunto de vértices.
• Er es un multiconjunto de aristas, donde cada arista es un par ordenado de vértices (opcionalmente puede tener una etiqueta que la identifique y una lista de atributos).
• ƒ: Vr x Vr x Vr es una función que para cada trío de vértices (Vi, Vj, Vk) retorna el costo de ir desde Vi hasta Vk a través de Vj, siendo Vk adyacente a Vj y Vj adyacente a Vi. De forma abreviada se hará referencia a esta función como la función de cruce.
• R es un conjunto de reglas de reescritura sobre (Vr, Er). Si el conjunto R de un grafo reducido es vacío, la función de cruce puede ser calculada a partir de la función de costo del grafo ponderado como ƒ (Vi, Vj, Vk) = ƒc (Vi, Vj) + ƒc (Vi, Vk), siendo Vk adyacente a Vj y Vj adyacente a Vi.

Definición 3. Sean G y Gr dos grafos y R = {r1, r2, ., rn} un conjunto de reglas de reescritura de grafos; se puede afirmar que Gr es un grafo reducido a partir de G, si al aplicar las reglas de reescritura especificadas en R al grafo Gr se obtiene el grafo G.

Definición 4. Sea un grafo G = (V, E) y una partición P sobre V; un vértice Vi V es interior si Vj V, tal que Vi y Vj son adyacentes, se cumple que Vi y Vj pertenecen a la misma clase de P. Un vértice Vi es exterior si V, tal que ((v, Vi) E o (Vi, v) E) y Vi y Vj no pertenecen a la misma clase de P.

Cuando se menciona el grafo original se hace referencia al grafo que es entrada de la iteración del algoritmo que se esté ejecutando, que puede ser un grafo distinto al existente antes de ejecutar el algoritmo de reducción por primera vez.

La propuesta tiene como entrada un grafo y una partición sobre los vértices del grafo de entrada. Sin embargo, puede ser necesario refinar esta partición; ya que para obtener un camino en el grafo reducido, de igual costo que el que se obtiene con el algoritmo de Dijkstra en el grafo original, es necesario que en dicho grafo reducido no existan pares de vértices que sean adyacentes y a su vez reducidos. Debido a esto, el primer paso del algoritmo de reducción consiste en refinar la partición que es entrada de dicho algoritmo (haciendo uso del Algoritmo 4 teniendo en cuenta la definición de vértice interior y exterior). Para ello se sigue la siguiente estrategia: dos vértices pertenecen a una clase de la nueva partición si y solo si están en la misma clase de la partición de entrada y son vértices interiores.

En la Figura 2 se ilustra con un ejemplo en qué consiste lo explicado anteriormente. En la misma se puede apreciar la modificación realizada a la partición inicial haciendo uso de la definición de vértice interior, con el objetivo de garantizar la obtención de caminos óptimos de igual costo en el grafo sin reducir.


Figura 2. Ejemplo de refinamiento de la partición. En el grafo de la parte superior se puede apreciar que los vértices 3, 4, 5 y 6 son exteriores; por cada uno de dichos vértices se creará una clase en la nueva partición.

Por cada clase de la partición refinada se crea un vértice en el grafo reducido. Si la cardinalidad de la clase es mayor que uno, el vértice que se crea se considera reducido; en otro caso se considera no reducido. Además, se propone el uso de una función (en este caso ObtenerNombre) que a partir de una clase de la partición, devuelva un identificador que será asociado a dicho vértice. En caso de que la clase tenga cardinalidad mayor que uno, la función retornará el valor del atributo utilizado para crear la clase; si la cardinalidad es uno, se retorna el identificador del vértice correspondiente a la clase en el grafo original.

Las aristas del grafo reducido se crean a partir de las clases de la partición refinada y del grafo original. Para ello se analiza cada par de clases de la partición, y si existe una arista entre dos vértices que pertenecen a clases distintas, se adiciona al grafo reducido. A medida que se van adicionando las aristas al grafo reducido se debe ir actualizando la función de costo.

Para construir las reglas de reescritura se parte de la Definición 1. Se crea una regla por cada vértice reducido. Este es un paso esencial en el algoritmo de reducción, es el que permite que no haya pérdida de información en la reducción del grafo y además garantiza que se pueda obtener el grafo original a partir del grafo reducido.

En primer lugar, para cada vértice reducido Vi se crea el grafo Gi; el mismo está formado por un vértice que representa la clase correspondiente de la partición refinada. Luego se crea el grafo Gj, formado por todos los vértices que pertenecen a la clase en cuestión y las aristas existentes entre dichos vértices en el grafo original. Luego, por cada arista del grafo original que incide en vértices que pertenecen a la clase de la partición se adiciona un cuádruplo al conjunto ?in, y por cada arista del grafo original que sale de un vértice de la clase hacia un vértice que no pertenece a dicha clase se adiciona un cuádruplo en ?out. De esta forma se garantiza que cuando se apliquen las reglas de reescritura al grafo reducido, se obtiene un nuevo grafo con los mismos vértices y aristas del grafo original; por lo que se garantiza que el proceso de reducción es reversible y no presenta pérdida de información.

El último paso consiste en calcular la función de cruce del grafo reducido. Esta función almacena para cada trío de vértices (Vi, Vj, vk), con Vk adyacente a Vj y Vj adyacente a Vi, el costo de ir desde Vi hasta Vk a través Vj. La función de cruce también puede ser vista como la forma de almacenar el costo de pasar por un vértice reducido. Para calcular esta función se crea un grafo auxiliar por cada vértice reducido a partir del grafo Gj de la regla de reescritura correspondiente. El objetivo de este grafo auxiliar es tener un grafo sobre el que se pueda realizar modificaciones para utilizarlo en el cálculo de la función antes mencionada.

Luego de adicionar los vértices y aristas del grafo Gj al grafo auxiliar, se adicionan los vértices adyacentes a cada vértice que pertenezca al grafo Gj. Estos vértices adyacentes se almacenan en la variable verticesAdyacentes para ser utilizados posteriormente.

Sobre el grafo auxiliar creado se aplica el Algoritmo 13 (MDijkstra), tomando como vértice de origen (Vo) cada uno de los vértices almacenados en la variable verticesAdyacentes; cada vez que se invoca este algoritmo se debe ir actualizando la función de cruce.

La función calculada almacena, además del costo de ir de un vértice a otro pasando por uno reducido, el propio camino; o sea, la secuencia de vértices a seguir de forma tal que con este valor precalculado se reduce el tiempo necesario para mostrar el camino óptimo.

Para calcular el camino antes mencionado se utiliza la función CamiN° La implementación de esta función parte del hecho que Pr es un vector que representa los predecesores de cada vértice en el camino óptimo desde el vértice de origen (vo) hasta el resto de los vértices del grafo. El camino desde Vo hasta Vd se obtiene recorriendo el vector Pr; en este recorrido se calcula cuál es el predecesor Vk del vértice Vd (Vk = Pr[Vd]); después se calcula el predecesor de Vk. Este proceso se repite hasta que el predecesor de algún vértice del camino coincida con el vértice de origen. La concatenación de los vértices, en orden inverso al encontrado, es el camino óptimo desde Vo hasta Vd.

Finalmente, se crea un grafo reducido utilizando los conjuntos de vértices, aristas, reglas de reescritura y la función de cruce.

El Algoritmo 3 muestra el pseudo-código del algoritmo de reducción. Además se presentan nuevos algoritmos para la implementación de dichos pasos.



El algoritmo de reducción de grafos propuesto tiene particular importancia en el trabajo con mapas debido a que los mismos siempre se muestran al usuario a una determinada escala; contar con un grafo reducido con el algoritmo anterior permitiría realizar análisis de redes en función de una determinada escala.

Por ejemplo, se puede relacionar cada iteración del algoritmo con una escala del mapa. En otras palabras, si se reduce agrupando todos los vértices que están en una misma provincia, el grafo reducido resultante representa la capa vectorial que pertenece al mapa a escala de provincia. Esto trae como consecuencia simplicidad en el análisis que se realice, ya que a una escala determinada pudieran perder importancia algunos objetos geográficos debido a que a esa escala, los mismos no son visibles o no son de interés para el análisis que se realiza.

Además, el Algoritmo 3 permite reducir un grafo sin que exista pérdida de información en el proceso, lo que contribuye a realizar análisis sobre el grafo reducido y obtener los mismos resultados que se obtienen en el grafo sin reducir.

Calculando la complejidad temporal de cada paso de los algoritmos presentados en este epígrafe se obtiene que la complejidad computacional del algoritmo de reducción propuesto: siendo n la cantidad de vértices del grafo original. Es válido aclarar que esta complejidad no afecta la búsqueda de caminos óptimos, ya que el proceso de reducción es un preprocesamiento de los datos, o sea, el grafo se reduce solamente una vez y luego de la reducción, se pueden realizar varias búsquedas de caminos óptimos.

BÚSQUEDA DE CAMINOS ÓPTIMOS

El análisis de redes en el presente modelo se realiza sobre un grafo reducido según el Algoritmo 3. En particular se describe cómo se realiza la búsqueda de caminos óptimos, para ello se debe tener en cuenta que se puede realizar el análisis según dos enfoques:

1. A escala, es decir, donde no se tengan en cuenta todos los objetos que existen en la capa vectorial utilizada como entrada del modelo; por ejemplo, cuál es el camino óptimo entre el municipio x y el y. Este tipo de pregunta debe estar acorde con la reducción realizada; para ello, se debe haber reducido el grafo según una partición que agrupe en la misma clase todos los vértices que pertenecen a un mismo municipio.
2. Teniendo en cuenta todos los objetos presentes en la capa vectorial que forma parte de la entrada del algoritmo de reducción.

La diferencia principal entre estos dos enfoques radica en la forma de obtener el grafo sobre el cual se va a realizar el análisis.

En el primer enfoque se debe utilizar un grafo en el que todos sus vértices estén a un mismo nivel de reducción; es decir, todos hayan sido reducidos utilizando la misma partición y por tanto están a la misma escala.

En el segundo enfoque deben existir vértices con distintos niveles de reducción. Esto se debe a que cuando se hace una búsqueda de camino óptimo en grafos grandes, el mecanismo que provee el modelo para lograr eficiencia es tener varios vértices reducidos; los vértices de origen y de destino no pueden estar reducidos en aras de obtener resultados exactos.

Para hacer búsqueda de caminos óptimos según los dos enfoques planteados se propone el uso de la estrategia que se describe a continuación.

En primer lugar, se debe modificar el grafo reducido en dependencia del enfoque que se desee seguir. Si el enfoque es el primero, es necesario tener todos los vértices del grafo a un mismo nivel, según la escala a la que se desee realizar el análisis. Para obtener este grafo se puede recorrer la lista de vértices y expandir cada vértice reducido haciendo uso del Algoritmo 11, de esta forma se obtendría el nivel de reducción anterior del grafo; si es más de un nivel bastaría con volver a aplicar lo descrito anteriormente.

Si el enfoque es el segundo habría que expandir vértices reducidos hasta que los vértices de origen (vo) y de destino (vd) estén en el grafo.

Se deben realizar dos tipos de expansiones, en uno de ellos se expande un vértice reducido (aplicando la regla de reescritura correspondiente) y en el otro se deben realizar expansiones de vértices reducidos hasta que aparezca en el grafo un vértice dado.

En el primer caso (Algoritmo 11) se parte de un vértice del grafo reducido y se aplica la regla de reescritura correspondiente. Para ello, se debe adicionar el grafo Gj al grafo reducido, conectar los vértices de Gj con los vértices del nuevo grafo, según ?in y ?out y, por último, eliminar el vértice reducido que se está expandiendo.

En el segundo caso (Algoritmo 12) se tiene en cuenta el carácter jerárquico de las particiones; por ejemplo, si el grafo se redujo por municipio y luego por provincia, para obtener a través de expansiones de vértices reducidos un vértice que se encuentra situado geográficamente en un determinado municipio, se debe expandir en primer lugar el vértice que se corresponde con la provincia y luego el que se corresponde con el municipio.

Para obtener el vértice reducido que contiene a un vértice dado (paso 3 del Algoritmo 12), se realiza un recorrido sobre el conjunto de vértices del grafo reducido y se comprueba con cuál vértice reducido está relacionado el vértice pasado como parámetro. Para esto se hace uso de las particiones utilizadas como entrada del Algoritmo 3 para reducir el grafo.

Cuando se encuentra el vértice reducido, se expande aplicando la regla de reescritura correspondiente. El pseudo-código correspondiente se muestra en el Algoritmo 10.

Una vez que se tiene un grafo reducido en el cual los vértices de origen y destino son vértices no reducidos, se aplica el Algoritmo 13 (MDijkstra). El mismo está basado en el algoritmo de Dijkstra. El algoritmo MDijkstra es uno de los principales aportes del presente trabajo, ya que garantiza la obtención de un camino óptimo en el grafo reducido, de igual costo que el camino óptimo encontrado por el algoritmo de Dijkstra en el grafo original (sin reducir). La modificación realizada sigue el siguiente principio: cada vez que se actualiza la distancia desde el pivote (ver línea 7, el vértice wn se denomina pivote) hasta un vértice adyacente que sea reducido (línea 13), se actualizan las distancias desde el pivote hasta todos los vértices adyacentes a dicho vértice reducido, haciendo uso de la función de cruce. Este algoritmo retorna un vector D con las distancias mínimas desde el vértice de origen al resto de los vértices, así como el vector P que contiene los predecesores de cada vértice en el camino óptimo desde el vértice de origen.

La función de cruce, calculada durante el proceso de reducción, es necesaria, ya que para obtener un camino óptimo se requiere conocer el costo de pasar por un vértice reducido. Este valor no queda asociado directamente a las aristas porque, en el caso de los grafos reducidos, el costo de una arista depende del camino en el cual se encuentren los vértices que conforman la misma.

Como se puede apreciar en la Figura 3, el efecto que tiene el costo de ir desde el vértice 2 al 13 en el cálculo de un determinado camino, depende si se llega al vértice 2 desde el vértice 7 o desde el 6. Cada vértice reducido representa un subgrafo del grafo original por lo que el costo de recorrer dicho subgrafo dependerá del vértice desde el cual se llega al mismo.


Figura 3. Ejemplo de grafo reducido.

Para obtener el camino óptimo a partir del vector P de predecesores se calcula el antecesor del vértice vd en el camino desde vo, a este vértice le llamaremos vaux = P[vd]. Luego, el antecesor del vértice encontrado (vaux) se calcula de la misma forma vaux = P[vaux]. Este proceso se repite hasta que vaux sea igual a Vo. El camino que se retorna es la concatenación de todos los vértices encontrados, en orden inverso.

La complejidad temporal del algoritmo BuscarCaminoOptimo es O(max[nvr * ?i, nvr * log nvr]) siendo nvr la cantidad de vértices del grafo reducido y ?i = max[lAil, Ai P?]. Teniendo en cuenta que en un grafo suficientemente grande ?i > nvr, entonces ?i > log nvr. Finalmente la complejidad sería O(nvr * ?i).

En un SIG, los vértices de origen y de destino para una petición de búsqueda de camino óptimo se seleccionan generalmente haciendo uso del mapa; es decir, un usuario selecciona estos puntos haciendo clic en el mapa que muestra el sistema. En este sentido, se asume que cuando un usuario selecciona un vértice de origen o destino, el SIG realiza una expansión de un vértice reducido teniendo en cuenta la porción del mapa que se está mostrando y el punto seleccionado.

Si un sistema para realizar búsquedas de caminos óptimos es implementado de esta forma, el tiempo necesitado para expandir un vértice reducido sería irrelevante para la búsqueda de caminos óptimos; considerando que la expansión de un vértice reducido tiene complejidad lineal O(?i), donde ?i = max[lAil, Ai P?]. De esta forma, el tiempo de respuesta ante una petición de búsqueda de camino estaría dado por la complejidad del Algoritmo MDijkstra.

Entre los algoritmos utilizados para búsqueda de caminos óptimos, el de menor complejidad temporal es el algoritmo A* cuando se utiliza una heurística óptima (la complejidad es O(n) donde n es el número de vértices del grafo). Por otra parte, la complejidad temporal del Algoritmo MDijkstra es O(n1 log n1), menor que n12, donde n1 es la cantidad de vértices del grafo reducido. Por tanto, si en el proceso de reducción se obtiene un grafo Gr = (Vr, Er) a partir de un grafo G = (V, E), tal que lVl la complejidad temporal del Algoritmo MDijkstra sería, en teoría, menor que la del Algoritmo A*.

Generalmente existe una relación inversa entre eficiencia y exactitud en los algoritmos que tienen como entrada un volumen elevado de datos. El principal resultado que se muestra, en cuanto a la búsqueda de caminos óptimos, es una mejora de la eficiencia en la búsqueda de caminos sin afectar la exactitud de la respuesta.

Para referirse a un grafo (Gi o Gj) de la regla de reescritura asociada a un vértice reducido vr se utilizará la notación vr.Gi y vr.Gj. Análogamente se utilizará la notación vr.?in y vr. ?out para referirse a los conjuntos ?in y ?out de la regla de reescritura asociada al vértice vr.


RESULTADOS EXPERIMENTALES

Para la validación del modelo se realizó la demostración de corrección de todos los algoritmos diseñados. Estas demostraciones no se incluyen por motivos de espacio. No obstante, se presentan algunos resultados experimentales que muestran la escalabilidad y eficiencia en la búsqueda de caminos mínimos haciendo uso de la propuesta. Los experimentos muestran además que el algoritmo de reducción propuesto garantiza que no existe pérdida de información.

Para la realización de los experimentos se implementó una biblioteca de clases basada en el modelo propuesto. Se utilizó el Lenguaje de Programación Python, la biblioteca de clases NetworkX [25], entre otras bibliotecas auxiliares. La biblioteca de clases NetworkX brinda una implementación de los algoritmos de Dijkstra y A*, entre otros. Esto permitió comparar el tiempo de ejecución del Algoritmo MDijkstra con el tiempo de ejecución de los dos antes mencionados, haciendo uso de la misma tecnología.

Para las pruebas experimentales se utilizaron tres grafos: el primero (G1), obtenido a partir de una capa vectorial (streets_wake.shp) del mapa del estado Carolina del Norte2, tiene 41810 vértices. Este grafo fue reducido dos veces (utilizando particiones basadas en el código postal) obteniéndose un grafo de 250 vértices (Gr1.1) y otro de 1826 vértices (Gr1.2). El segundo grafo (G2) se obtuvo a partir de la capa vectorial (grnf012r05a_e.shp) que representa la red de viales de Nova Scotia3 (Canadá) y tiene 63509 vértices. Este grafo fue reducido dos veces (utilizando dos particiones de vértices de forma tal que todos los vértices de una clase de la partición estuvieran conectados a través de un camino) obteniéndose un grafo de 517 vértices (Gr2.1) y otro de 936 vértices (Gr2.2). El tercer grafo representa la red de viales de la ciudad de San Francisco4, cuenta con 174956 vértices (G3) y también fue reducido dos veces (utilizando dos particiones de vértices de forma tal que todos los vértices de una clase de la partición estuvieran conectados a través de un camino), obteniéndose un grafo de 769 vértices (Gr3.1) y el otro de 2617 vértices (Gr3.2).

Para la obtención de los grafos G1 y G2 a partir de archivos en formato shape, se utilizó la función read_shp de la biblioteca NetworkX. El grafo G3 se creó a partir de dos archivos en texto plano; uno con los vértices y el otro con las aristas.

A partir de los datos anteriores, se han definido los siguientes elementos presentes en el diseño de los experimentos:

• Unidad básica de análisis: Grafos.
• Población: Grafos obtenidos a partir de los mapas mencionados anteriormente. La característica distintiva que tienen todos los miembros de la población es que deben ser grafos conexos.
• Muestra:
Grafo G1: Grafo con 41810 vértices.
Grafo Gr1.1: Grafo con 250 vértices.
Grafo Gr1.2: Grafo con 1826 vértices.
Grafo G2: Grafo con 63509 vértices.
Grafo Gr2.1: Grafo con 517 vértices.
Grafo Gr2.2: Grafo con 936 vértices.
Grafo G3: Grafo con 174956 vértices.
Grafo Gr3.1: Grafo con 769 vértices.
Grafo Gr3.2: Grafo con 2617 vértices.

Se hará referencia a los grafos G1, G2 y G3 como los grafos originales y a los restantes como los grafos reducidos.

Los experimentos fueron ejecutados en una Computadora Personal (PC) con un procesador Intel Pentium 4 de 3.20 GHz [512 Kb de cache] con I. 5 Gb RAM, sobre el sistema operativo Kubuntu II. 10. A continuación se enumeran los experimentos realizados:

• Experimento 1: Aplicar los algoritmos de Dijkstra y A* a los grafos originales.
• Experimento 2: Aplicar el Algoritmo MDijkstra a los grafos reducidos.

Cada algoritmo se ejecutó 10 veces registrándose el tiempo de ejecución, descartándose el mayor y menor valor en cada caso. Finalmente, se calculó el promedio de los restantes 8 valores. Los resultados de los experimentos 1 y 2 se resumen en la Tabla 1. La última columna indica si el algoritmo en cuestión obtuvo el valor óptimo.

Como se puede apreciar en la Tabla 1, el algoritmo MDijkstra, propuesto en este trabajo, obtiene un camino óptimo de igual costo al obtenido por el algoritmo de Dijkstra en el grafo original; lo que evidencia que el modelo presentado representa una red de forma adecuada.

Tabla 1. Resultados experimentales.

También se puede afirmar que el modelo de representación propuesto garantiza escalabilidad en la búsqueda de caminos óptimos. Esta afirmación se basa en que dado un grafo conexo se puede encontrar una partición que genere un grafo lo suficientemente reducido para que el tiempo de respuesta ante una petición de búsqueda de camino óptimo sea del orden de milisegundos; tal como se muestra en los resultados experimentales obtenidos.

Varios algoritmos heurísticos se han diseñado para reducir el tiempo de respuesta de la búsqueda de caminos óptimos en SIG reduciendo el espacio de búsqueda de la solución, para ello se asume que un bajo porcentaje de error es admisible en esta área. Como se puede apreciar en la Tabla 1, el algoritmo A* retorna una respuesta en tiempos menores que el algoritmo de Dijkstra, pero en algunos casos no alcanza el óptimo. Sin embargo, con el modelo propuesto es posible obtener un camino óptimo en un tiempo similar al que presentan algunos algoritmos heurísticos, e incluso menor, como se muestra en la tabla antes mencionada. Además, el Algoritmo MDijkstra es escalable en la muestra seleccionada, el tiempo de respuesta varía entre 0,004 y 0,072 segundos (una diferencia de 6,8 milisegundos) para un incremento de 107955 vértices del grafo original.

Adicionalmente, en [26] se presenta una imple-mentación del modelo propuesto en esta investigación, mostrando la viabilidad de implementación como parte de un motor de persistencia de grafos que realiza el análisis en memoria externa. Lo cual sería conveniente si se cuenta con una PC que no posee recursos de hardWare suficientes para realizar el análisis en RAM.

CONCLUSIONES

En el presente artículo se ha descrito un modelo para la representación de redes en SIG basado en grafos reducidos. Como parte del mismo se han diseñado varios algoritmos. También se describe un algoritmo para realizar búsquedas de caminos óptimos en grafos reducidos garantizando escalabilidad y eficiencia en el análisis.

Finalmente se concluye lo siguiente:

• Al obtener un grafo a partir de una red representada en una capa vectorial de un mapa, se cuenta con un modelo robusto y a la vez flexible para la realización de análisis de redes. Este es un modelo ampliamente estudiado y cuenta con una gran variedad de aplicaciones.
• El uso de la reescritura de grafos propuesta permite reducir un grafo sin que exista pérdida de información.
• El uso de un grafo reducido para realizar búsqueda de caminos óptimos permite dar respuesta de forma eficiente cuando las redes son grandes.
• El uso de grafos reducidos para la representación de redes en SIG facilita la realización de análisis de redes a diferentes escalas.
• La generalidad del modelo propuesto radica en la posibilidad de su aplicación en distintos tipos de redes debido a que se garantiza que no existe pérdida de información.

2http://grass.osgeo.org/sampledata/north_carolina/
3http://geodepot.statcan.ca/diss/2006dissemination/data/frr_rnf_e.cfm
4http://www.cs.fsu.edu/~lifeifei/SpatialDataset.htm

REFERENCIAS

[1] S. Aronoff. "Geographical Information Systems: A management perspective". WDL Publications. Ottawa, Canadá, pp. 294. 1989.

[2] ESRI Shapefile Technical Description. pp. 1-5. 1998. Fecha de consulta: 10 de junio de 2011. Disponible en: www.esri.com/library/whitepapers/pdfs/shapefile.pdf

[3] L. Daniel, P. Loree and A. Whitener. "Inside MapInfo Professional". OnWord Press. Third ed. New York, USA, pp. 576. 2001. ISBN: 0766834727.

[4] M. Haklay and P. Weber. "OpenStreetMap: User-Generated Street Maps". IEEE Pervasive Computing. Vol. 7 N° 4, pp. 12-18. Octubre 2008. ISSN: 1536-1268.

[5] G. Korte. "The Gis Book". OnWord Press. fifth ed. New York, USA, pp. 387. 2001. ISBN: 9780766828209.

[6] pgRouting Project. 2011. Fecha de consulta: 16 de marzo de 2011. Disponible en: http://www.pgrouting.org/

[7] F. Campos Gutiérrez, J.P. Castro Fernández and R. García Martín. "IDELabRoute: Librería para la gestión de grafos escalable". IV Jornadas SIG Libre. Girona, España. Marzo 2010.

[8] pgRouting. Routing from point to point. 2011. Fecha de consulta: 16 de marzo de 2011. Disponible en: http://pgrouting.postlbs.org/discussion/topic/353

[9] R.R. Puente and R.S. Castro. "Enfoque de hipergrafos en sistemas de información geográfica para la modelación de redes". VII Congreso Internacional Geomática 2011. La Habana, Cuba. Febrero 2011.

[10] R. Angles and C. Gutiérrez. "Survey of graph database models". ACM Computing Surveys. Vol. 40 N° 1, pp. 1-39. Febrero 2008. ISSN: 0360-0300. DOI:10.1145/1322432.1322433.

[11] C. Vicknair, M. Macias, Z. Zhao, X. Nan, Y. Chen and D. Wilkins. "A comparison of a graph database and a relational database: a data provenance perspective". 48th Annual Southeast Regional Conference. Oxford, Mississippi, USA. Abril 2010.

[12] E.W. Dijkstra. "A Note on Two Problems in Connection with Graphs". Numerische Mathematik. Vol. 1, pp. 269-271. Diciembre 1959. ISSN: 0029-599X. DOI:10.1007/BF01386390.

[13] P. Hart, N. Nilsson and B. Raphael. "A Formal Basis for the Heuristic Determination of Minimum Cost Paths". IEEE Transactions on Systems Science and Cybernetics. Vol. 4 N° 2, pp. 100-107. Julio 1968. ISSN: 0536-1567. DOI:10.1109/TSSC.1968.300136.

[14] GRASS Programmer's Manual: Directed Graph Library. 2008. Fecha de consulta: 16 de marzo de 2011. Disponible en: http://grass.osgeo.org/programming6/dglib.html

[15] R. Blazek, M. Neteler and R. Micarelli. "The new GRASS 5.1 vector architecture". Open source GIS-GRASS users conference. University of Trento, Italy. Septiembre 2002.

[16] S. Wasserman and K. Faust. "Social Network Analysis. Methods and Applications". Cambridge University Press. Cambridge, UK, p. 857. 1995. ISBN: 0521387078.

[17] R. Sedgewick and K. Wayne. "Algorithms". Addison-Wesley Professional. Fourth ed. Boston, USA, p. 976. 2011. ISBN: 978-0321573513.

[18] S.P. Borgatti and D.S. Halgin. "On Network Theory". Organization Science. Vol. 22. N° 5, pp. 1168-1181. Abril 2011. ISSN: 1526-5455. DOI:10.1287/orsc.1100.0641

[19] P. Sanders and D. Schultes. "Highway hierarchies hasten exact shortest path queries". 13th annual European conference on Algorithms. Palma de Mallorca, España. Octubre 2005.

[20] Z. Wang, O. Che, L. Chen and A. Lim. "An efficient shortest path computation system for real road networks". 19th international conference on Advances in Applied Artificial Intelligence: industrial, Engineering and Other Applications of Applied Intelligent Systems. Annecy, France. Junio 2006.

[21] G. Jagadeesh and T. Srikanthan. "Route computation in large road networks: a hierarchical approach". Intelligent Transport Systems. Vol. 2 N° 3, pp. 219-227. Septiembre 2008. ISSN: 1751-956X. DOI:10.1049/iet-its:20080012.

[22] Q. Song and X. Wang. "Efficient Routing on Large Road Networks Using Hierarchical Communities". IEEE Transactions on Intelligent Transportation Systems. Vol. 12 N° 1, pp. 132-140. Marzo 2011. ISSN: 1524-9050. DOI:10.1109/TITS.2010.2072503.

[23] F.E. Cellier and J. Greifeneder. "Continuous System Modeling". Springer-Verlag. NJ, USA, p. 755. 1991. ISBN 978-0-387-97502-3.

[24] M. de Berg, O. Cheong, M. van Krefeld and M. Overmars. "Computational Geometry: Algorithms and Applications". Springer-Verlag. Third ed. New York, USA, p. 386. 2008.

[25] A.A. Hagberg, D.A. Schult and P.J. Swart. "Exploring network structure, dynamics, and function using NetworkX". 7th Python in Science Conference. Pasadena, CA, USA. Agosto 2008.

[26] J.A. Inda Herrera, R. Rodríguez Puente y M. Lazo Cortés. "Sistema para la búsqueda de caminos mínimos en grafos grandes". I Taller de Geoninformática. La Habana, Cuba. Febrero 2012.


Recibido 2 de septiembre de 2011, aceptado 23 de abril de 2013


Artículos Relacionados

# Título Ver
1
Estudio exploratorio del impacto de la red social en el nivel individual de aceptación de sistemas empresariales (2012)
Patricio Ramírez Correa, Jorge Alfaro Pérez
HTML | PDF
2
Desarrollo de una base de datos integrada de Censo y encuesta mediante el uso de elementos de inteligencia de negocios y SIG (2014)
Robert Cornejo, Mónica Navarrete, Ricardo Valdivia, Patricio Aroca, Sebastián Aracena
HTML | PDF
3
Factores que afectan la formación de redes para el aprendizaje colaborativo: un estudio empírico conducido en una universidad chilena (2015)
Patricio Ramírez-Correa, Carolina Fuentes-Vega
HTML | PDF


Otros Artículos

# Título Ver
1
Efectos del tratamiento térmico y del método de colección sobre la estructura cristalina de las nanofibras electrohiladas de ácido poli (láctico) (2019)
Edwin Gómez-Pachón, Ricardo Vera-Graziano, Raúl Montiel, William Cardenas-Aguazaco, Andrés Felipe Ochica
PDF
2
Mitigación de la corrosión de estructuras enterradas mediante la modificación de suelos (2011)
V. C. Córdoba, M. A. Mejía, F. Echeverría, M. Morales, J. A. Calderón
HTML | PDF
3
Estilos de liderazgo y resultados del sistema de medición de la calidad de la educación: un estudio empírico en los colegios básicos de la ciudad de Arica-Chile (2009)
Liliana Pedraja Rejas, Emilio Rodríguez Ponce, Manuel Barreda Olavarría, Omar Sagredo Núñez, Cristian Segovia León
HTML | PDF

Desarrollado por: Cristian Díaz Fonseca - cfonseca@matiasluke.cl