Más

¿Creando una base de datos espacial con muchas categorías que tienen el mismo conjunto de valores?

¿Creando una base de datos espacial con muchas categorías que tienen el mismo conjunto de valores?


Estoy trabajando en la creación de una base de datos espacial de datos agrícolas del condado donde cada condado tiene varios cultivos (más de 30) y para cada cultivo hay varias métricas de producción (rendimiento, área cosechada, valor económico, etc.) que son iguales para todos los cultivos. También tengo esta información durante muchos años, desde 1980.

¿Qué piensa de un diseño de base de datos espacial que permita consultar fácilmente una métrica de producción para un cultivo en particular por condado?


Dada la naturaleza de sus datos y la cantidad de atributos que tiene, no tiene más remedio que dividirlos en diferentes tablas. Desde la ayuda de ArcGIS:

La mayoría de los límites de tamaño en una base de datos dependen de la edición de DBMS y las limitaciones del hardware. Una excepción es la cantidad de campos (columnas) admitidos en una tabla o clase de entidad; el número máximo es 500. Sin embargo, tenga en cuenta que, según los tipos de datos, el número máximo de columnas en una tabla podría ser inferior a 500. La mayoría de los proveedores de bases de datos no recomiendan crear tablas con más de 200 columnas de cualquier tipo de datos.

No especifica qué DBMS planea usar, por lo que las capacidades ofrecidas pueden variar entre las opciones. Mencionas que es relacional, lo que reduce un poco las opciones (es decir, una geodatabase de archivos Esri no va a funcionar).

Elegir un DBMS es una cosa y organizar los datos en ese DBMS es otra. Mi comentario mencionó Tablas relacionadas desde una perspectiva de geodatabase de archivos: hace clic en un condado, le muestra todos los registros asociados con ese condado de otra tabla vinculada por un Relate. No sé lo suficiente sobre el diseño de bases de datos para decir lo que sería mejor (y estas preguntas son generalmente cerradas aquí por ser demasiado amplias o basadas en opiniones). Tabla por cultivo, tabla por año ... hay muchas opciones, y como mencioné en mi comentario, lo que planea acceder a la base de datos puede jugar un papel (es decir, los problemas que tiene el software GIS con la tabla de uno a muchos o de muchos a muchos relaciones). Mi pensamiento inicial sería tabla por año con todos los cultivos, sabiendo que automáticamente lo ubica en más de 200 campos, pero sería uno a uno. También puedo ver tabla por cultivo con todos los años en una sola tabla para cada cultivo, pero nuevamente depende de cómo acceda a él porque sería uno a muchos.

Luego te sumerges en el ajuste del rendimiento ...


¿Creando una base de datos espacial con muchas categorías que tienen el mismo conjunto de valores? - Sistemas de Información Geográfica

Después de habilitar GeoRaster para todos los esquemas que usarán la función, crear los objetos GeoRaster, cargar los datos y validar los objetos GeoRaster, puede realizar las operaciones restantes en cualquier orden, según las necesidades de su aplicación. También puede omitir ciertas operaciones.

Algunas operaciones pueden realizarse usando SQL y algunas operaciones deben realizarse usando bloques PL / SQL. Debe actualizar el objeto GeoRaster después de insertar, actualizar, reformatear, comprimir, descomprimir o eliminar los metadatos o datos de celda del objeto GeoRaster y antes de confirmar los cambios (consulte Actualización de objetos GeoRaster antes de confirmar). Para ver algunos ejemplos de estas operaciones, consulte los archivos de demostración descritos en GeoRaster PL / SQL y Archivos de demostración de Java y los ejemplos en SDO_GEOR Package Reference.

3.1 Habilitación de GeoRaster a nivel de esquema

GeoRaster debe estar habilitado para cada esquema de base de datos que utilizará la función GeoRaster.

De forma predeterminada, la función GeoRaster está desactivada después de que Oracle Spatial se instala inicialmente. GeoRaster se puede habilitar solo dentro del alcance de un esquema (es decir, no para toda la base de datos), y debe habilitarse para cada esquema que usará la función GeoRaster.

Para habilitar GeoRaster, siga estos pasos para cada esquema para el que se habilitará GeoRaster:

Si se creó una tabla GeoRaster y se completó con datos, luego de una actualización de la base de datos, GeoRaster se habilita automáticamente para el esquema de esa tabla y no es necesario volver a habilitar GeoRaster para el esquema. (Solo asegúrese de que se otorgue el privilegio CREATE TABLE al usuario).

3.2 Agregar archivos de datos y espacios de tabla temporales para usuarios de GeoRaster

Una base de datos de GeoRaster suele ser muy grande. Por razones de almacenamiento y rendimiento, un esquema de base de datos debe usar uno o más espacios de tabla de usuario para el almacenamiento de datos de GeoRaster (evite usar el espacio de tabla del sistema para almacenar datos de GeoRaster), y debe agregar archivos de datos a los espacios de tabla de manera apropiada. Si no se utiliza Oracle Automatic Storage Management (Oracle ASM) o un espacio de tabla de bigfile, debe crear muchos archivos de datos para cada espacio de tabla y distribuir los archivos de datos en diferentes discos si es posible. También debe crear archivos de datos o modificar los archivos de datos existentes para que aumenten de tamaño automáticamente cuando se necesite más espacio en la base de datos.

Una tabla GeoRaster puede contener una gran cantidad (potencialmente casi ilimitada) de objetos GeoRaster. Se debe usar una tabla de datos ráster (RDT) para contener los bloques ráster de un número limitado de objetos GeoRaster, dependiendo del tamaño de los rásteres. A diferencia de las tablas GeoRaster, una RDT no debe crecer demasiado, a menos que se aplique una partición. Además, las RDT se pueden crear en diferentes espacios de tabla, de modo que los bloques ráster se distribuyan en diferentes discos. (Consulte también Creación de la tabla GeoRaster y las tablas de datos ráster).

Una base de datos GeoRaster puede utilizar un espacio de tabla temporal para algunas operaciones. Cuando la compresión está involucrada en las operaciones de GeoRaster, particularmente para operaciones de creación de mosaicos a gran escala, se necesitan algunos espacios temporales para almacenar datos intermedios comprimidos o sin comprimir. Si el usuario de GeoRaster no tiene un espacio de tabla temporal, se utiliza el espacio de tabla temporal del sistema de base de datos. Esto no es eficaz y puede ralentizar el mosaico y otras operaciones. Por lo tanto, siempre debe crear espacios de tabla temporales para los usuarios de GeoRaster. Por ejemplo:

En general, la cantidad de espacio temporal necesario es limitada. Sin embargo, para mosaicos a gran escala, si el resultado se va a comprimir, el espacio temporal necesario es igual al tamaño de la imagen sin comprimir del resultado. Por lo tanto, especifique AUTOEXTEND ON cuando cree espacios de tabla temporales para usuarios de GeoRaster.

3.3 Creación de la tabla GeoRaster y las tablas de datos ráster

Antes de poder trabajar con objetos GeoRaster, debe crear una tabla GeoRaster y una o más tablas de datos ráster, si aún no existen.

3.3.1 Creación de una tabla GeoRaster

Una tabla GeoRaster es cualquier tabla que incluye al menos una columna de tipo SDO_GEORASTER. La columna puede ser una columna de atributo de otro tipo de objeto definido por el usuario. El ejemplo 3-1 crea una tabla GeoRaster denominada CITY_IMAGES, que contiene una columna denominada IMAGEN para almacenar objetos GeoRaster.

Ejemplo 3-1 Creación de una tabla GeoRaster para imágenes de ciudades

Para obtener más información sobre las tablas de GeoRaster, consulte Almacenamiento físico de GeoRaster.

3.3.2 Creación de tablas de datos ráster

Después de crear una tabla GeoRaster, debe crear una o más tablas de datos ráster (RDT) para usar con los objetos en la tabla GeoRaster. Puede crear una tabla de datos ráster como una tabla de objetos o como una tabla relacional. Debe utilizar el formato de almacenamiento LOB SecureFiles LOB (SecureFiles) al crear RDT. El uso de SecureFiles mejora significativamente el rendimiento de las operaciones de GeoRaster, en comparación con el uso del paradigma de almacenamiento LOB original BasicFiles LOBS (BasicFiles).

El ejemplo 3-2 crea una tabla de datos ráster utilizando SecureFiles. La RDT se utilizará para almacenar todos los bloques ráster de uno o varios objetos GeoRaster en la tabla CITY_IMAGES u otras tablas GeoRaster. (La asociación entre un objeto GeoRaster y una tabla de datos ráster no se realiza hasta que crea un objeto GeoRaster, como se explica en Creación de nuevos objetos GeoRaster).

Ejemplo 3-2 Creación de una tabla de datos ráster con SecureFiles

Ejemplo 3-3 Creación de una tabla de datos ráster (relacional) mediante SecureFiles

El Ejemplo 3-3 crea una tabla de datos ráster con el mismo nombre que en el Ejemplo 3-2, también usando SecureFiles, pero creándola como una tabla relacional en lugar de una tabla de objetos.

La declaración CREATE TABLE para una tabla de datos ráster debe incluir la siguiente cláusula (que se incluye en los ejemplos anteriores):

Esta cláusula PRIMARY KEY crea un índice de árbol B en la tabla de datos ráster, y este índice es esencial para un rendimiento óptimo de la consulta.

Cuando utiliza BasicFiles, puede especificar un tamaño de CHUNK más grande (16 o 32 KB) para el almacenamiento LOB para mejorar el rendimiento. Con SecureFiles, no es necesario especificar el parámetro de tamaño CHUNK y hay algunos otros parámetros de almacenamiento a considerar. Las tablas de datos ráster que utilizan SecureFiles LOB deben crearse en un espacio de tabla con la opción de gestión automática del espacio de segmento. Para obtener información sobre el uso de Oracle SecureFiles y consideraciones de rendimiento para BasicFiles LOB, consulte la Guía para desarrolladores de Oracle Database SecureFiles y Large Objects.

Para obtener información de referencia sobre la creación de tablas, incluida la especificación de almacenamiento LOB, consulte la sección sobre la declaración CREATE TABLE en Referencia del lenguaje SQL de la base de datos Oracle.

Para obtener más información sobre las palabras clave y las opciones al crear una tabla de datos ráster, consulte Tabla de datos ráster.

3.3.3 Disparador DML de GeoRaster

Para garantizar la coherencia e integridad de las tablas y estructuras de datos internas de GeoRaster, GeoRaster crea automáticamente un disparador DML único para cada columna de GeoRaster cada vez que un usuario crea una tabla de GeoRaster (es decir, una tabla con al menos una columna de GeoRaster), con la siguiente excepción : si usa la instrucción ALTER TABLE para agregar una o más columnas GeoRaster, debe llamar al procedimiento SDO_GEOR_UTL.createDMLTrigger para crear el disparador DML en cada columna GeoRaster agregada. En algunos escenarios, como una actualización de la base de datos o una migración de datos, puede llamar al procedimiento SDO_GEOR_UTL.recreateDMLTriggers para volver a crear los disparadores DML en todas las columnas de GeoRaster.

El disparador se activa después de cada una de las siguientes operaciones de lenguaje de manipulación de datos (DML) que afectan a un objeto GeoRaster: inserción de una fila, actualización de un objeto GeoRaster y eliminación de una fila.

GeoRaster realiza automáticamente las siguientes acciones cuando se activa el disparador:

Después de una operación de inserción, el desencadenador inserta una fila con el nombre de la tabla GeoRaster, el nombre de la columna GeoRaster, el nombre de la tabla de datos ráster y el valor de rasterID en la vista USER_SDO_GEOR_SYSDATA (descrita en Vistas de datos del sistema GeoRaster (xxx_SDO_GEOR_SYSDATA)). Si ya existe una entrada idéntica, se genera una excepción.

Después de una operación de actualización, si el nuevo objeto GeoRaster es nulo o está vacío, el desencadenador elimina el antiguo objeto GeoRaster. Si no hay una entrada en la vista USER_SDO_GEOR_SYSDATA para el objeto GeoRaster antiguo (es decir, si el objeto GeoRaster antiguo es nulo), el desencadenador inserta una fila en esa vista para el nuevo objeto GeoRaster. Si hay una entrada en la vista USER_SDO_GEOR_SYSDATA para el antiguo objeto GeoRaster, el disparador actualiza la información para reflejar el nuevo objeto GeoRaster.

Después de una operación de eliminación, el disparador elimina bloques de datos ráster para el objeto GeoRaster en su tabla de datos ráster y elimina la fila en la vista USER_SDO_GEOR_SYSDATA para el objeto GeoRaster.

3.4 Creación de nuevos objetos GeoRaster

Antes de poder almacenar una imagen GeoRaster en una tabla GeoRaster, debe crear el objeto GeoRaster e insertarlo en una tabla GeoRaster antes de comenzar a trabajar en él. Para crear un nuevo objeto GeoRaster, tiene las siguientes opciones:

Inicialice un objeto GeoRaster vacío, usando la función SDO_GEOR.init.

Cree un objeto GeoRaster en blanco, utilizando la función SDO_GEOR.createBlank.

No puede realizar ninguna operación de GeoRaster si el objeto no se ha creado correctamente (es decir, si el objeto es un nulo atómico). Las funciones SDO_GEOR.init y SDO_GEOR.createBlank inicializan los objetos GeoRaster con su tabla de datos ráster y los valores de ID de ráster si aún no están especificados, y el disparador DML de GeoRaster asegura que el nombre de la tabla de datos ráster y el par de valores de ID de ráster sean únicos para el valor actual. usuario.

Si el nuevo objeto GeoRaster contendrá datos de celdas ráster (como resultado de otro procedimiento GeoRaster, como SDO_GEOR.importFrom, SDO_GEOR.subset o SDO_GEOR.copy), y si la tabla de datos ráster para este nuevo objeto GeoRaster no existe, debe primero cree la tabla de datos ráster. Para obtener información sobre cómo crear una tabla de datos ráster, incluidos ejemplos, consulte Creación de tablas de datos ráster.

Para evitar posibles problemas con los datos de GeoRaster (algunos de los cuales se describen en Mantenimiento de objetos de GeoRaster y datos del sistema en la base de datos), se debe registrar un objeto de GeoRaster inicializado en las vistas del sistema de GeoRaster, lo que se hace automáticamente cuando inserta el objeto de GeoRaster en un GeoRaster mesa. Esto debe hacerse antes de realizar cualquier otra operación en el objeto GeoRaster. Cualquier operación de GeoRaster que necesite manipular la tabla de datos ráster genera una excepción si el objeto GeoRaster de origen o de destino no está registrado.

3.5 Carga de datos ráster

Para cargar y exportar imágenes o datos ráster, puede considerar las herramientas ETL de terceros (consulte la nota en Herramientas GeoRaster: Viewer_ Loader_ Exporter). Por ejemplo, puede utilizar la línea de comandos gdal_translate y otras utilidades de GDAL, que son totalmente compatibles con GeoRaster a través del controlador Oracle Spatial GeoRaster.

También puede usar funciones en GeoRaster para cargar datos ráster. Con GeoRaster, tiene las siguientes opciones:

Utilice la herramienta ETL basada en GDAL para la carga y exportación simultánea de lotes. Esta herramienta se describe en el Asistente de ETL basado en GDAL para la carga y exportación simultánea de lotes.

En PL / SQL, llame al procedimiento SDO_GEOR_GDAL.translate para cargar imágenes en objetos GeoRaster.

En PL / SQL, llame al procedimiento SDO_GEOR.importFrom para cargar imágenes en objetos GeoRaster.

Utilice la herramienta de visualización o la herramienta de visualización GeoRaster basada en JAI, que se describen en Viewer_ Loader_ and Exporter basado en JAI.

Con las dos últimas opciones (SDO_GEOR.importFrom y la herramienta basada en JAI), puede hacer lo siguiente:

Comprima datos ráster y almacene los datos en objetos GeoRaster comprimidos en JPEG o comprimidos en DEFLATE.

Cargue un archivo mundial ESRI o un archivo de texto RPC Digital Globe (.rpb) en un objeto GeoRaster existente y georeferenciar los datos ráster sin recargarlos. También puede especificar un SRID con el archivo mundial y generar la extensión espacial de los datos.

Cargue un archivo en formato GeoTIFF con georreferenciación, con o sin datos ráster. Para cargar y exportar la información de georreferenciación de imágenes GeoTIFF, se requieren las bibliotecas GeoTIFF. Consulte Georreferenciación de objetos GeoRaster para obtener instrucciones.

Después de cargar datos ráster en un objeto GeoRaster, debe asegurarse de que el objeto sea válido llamando a la función SDO_GEOR.validateGeoRaster, como se explica en Validación de objetos GeoRaster.

Porque un archivo mundial de ESRI o. rpb no contiene información del sistema de coordenadas, puede especificar el valor SRID de un sistema de referencia de coordenadas para la operación de carga. Sin embargo, si no especifica un SRID, el cargador establece el SRID del modelo de los objetos GeoRaster en 0 (cero), lo que significa que el objeto GeoRaster no es válido y, por lo tanto, debe utilizar el procedimiento SDO_GEOR.setModelSRID para especificar un espacio modelo válido para este objeto. Si aún no conoce el sistema de coordenadas del espacio modelo, puede especificar el valor SRID como 999999, lo que significa que se desconoce el sistema de referencia de coordenadas. (Específicamente, SRID 999999 está asociado con un sistema de referencia de coordenadas llamado CRS desconocido). Más adelante, cuando conozca el sistema de referencia de coordenadas real del espacio modelo, puede establecer el valor de SRID en consecuencia.

Para obtener más información sobre el sistema de referencia de coordenadas CRS desconocido (SRID 999999), consulte la Guía del desarrollador espacial de Oracle.

3.5.1 Carga con bloqueo y relleno óptimo

A menos que desee cargar imágenes JPEG o JPEG2000 y almacenarlas sin ningún cambio, cuando cargue una imagen o un archivo ráster en un objeto GeoRaster, siempre considere y aplique el bloqueo apropiado de los datos, porque los formatos de archivo pueden tener esquemas de bloqueo muy diferentes. En general, los tamaños de bloqueo deben ser de 512 x 512 o más. No existe una regla absoluta para los tamaños de bloqueo, pero cuanto más grande sea el ráster, mayores serán los tamaños de bloqueo que puede utilizar. Para rásteres regulares, es apropiado 512x512 a 2048x2048. Para imágenes muy pequeñas (menos de 1024x1024x3), no bloquear puede ser una buena opción. Evite los tamaños de bloqueo que sean demasiado pequeños (como 64x64 y 128x128) o demasiado grandes, y evite los tamaños de bloqueo extremos, como 0,5 (la mitad), 1 u 8 filas de píxeles por bloque. Generalmente, la forma rectangular de los bloques debe ser un cuadrado o cerca de un cuadrado. Para diferentes aplicaciones, puede ajustar el bloqueo para equilibrar el almacenamiento eficiente con un rendimiento óptimo.

También debe aplicar siempre un acolchado óptimo durante la carga. En otras palabras, especifique el bloqueo = OPTIMALPADDING además de especificar el tamaño del bloque. GeoRaster aplica relleno a la columna derecha y la fila inferior de bloques para que tengan el mismo tamaño que otros bloques. Si el tamaño del bloque no es óptimo para un ráster específico, el relleno resultante predeterminado desperdiciaría algo de espacio de almacenamiento. Cuando especifica el bloqueo = OPTIMALPADDING, todos los procedimientos de GeoRaster y las herramientas ETL ajustan automáticamente la matriz de tamaño de dimensión de GeoRaster para que sea óptima para reducir la cantidad de relleno en el almacenamiento de objetos de GeoRaster. El ajuste siempre se realiza en torno a los valores especificados por el usuario. Consulte la explicación de la palabra clave de bloqueo en la tabla de las Notas de uso del procedimiento SDO_GEOR_UTL.calcOptimizedBlockSize.

Para saber cómo aplicar un relleno óptimo cuando se usa la línea de comando GDAL, consulte el siguiente ejemplo:

Para saber cómo aplicar un relleno óptimo al utilizar el procedimiento SDO_GEOR.importFrom, consulte los ejemplos en el tema de referencia para ese procedimiento.

3.5.2 Carga de imágenes JPEG y JPEG 2000 sin descompresión

GeoRaster admite la compresión JPEG, en la que los bloques de GeoRaster se almacenan como archivos JPEG. GeoRaster también admite la compresión JPEG 2000, en la que GeoRaster tiene un solo bloque almacenado como un archivo JPEG 2000. Hay algunos casos especiales en los que puede cargar y exportar imágenes JPEG o JPEG 2000 sin descomprimir y volver a comprimir, mejorando así el rendimiento de manera significativa.

Para JPEG, puede usar el cargador GeoRaster basado en JAI para cargar la imagen directamente sin descompresión y recompresión si el archivo de imagen es un archivo JPEG, el tipo de compresión del objeto GeoRaster se especifica como JPEG-F y no se especifica ningún bloqueo para el objeto GeoRaster. almacenamiento (es decir, el objeto GeoRaster tiene solo un bloque).

Para JPEG 2000, puede usar GDAL o la herramienta GeoRaster ETL basada en GDAL para cargar la imagen directamente sin descompresión y recompresión & # x2013 si el archivo de imagen es un archivo JPEG2000 y si ningún parámetro en uso requiere algún cambio en la estructura interna de el archivo JPEG 2000.Por ejemplo, la siguiente secuencia de comandos carga el archivo JPEG 2000 directamente sin descompresión.

Sin embargo, si alguno de los parámetros en uso requiere cambiar la estructura interna de los datos JPEG 2000, la carga directa no será posible. El siguiente ejemplo requiere descompresión y recompresión, lo que resulta en un aumento sustancial del tiempo de carga.

3.5.3 Reformateo del ráster de origen antes de cargarlo

El cargador basado en JAI de GeoRaster no admite archivos ráster de origen en el entrelazado BSQ y puede generar un error de "memoria insuficiente" si los archivos son demasiado grandes y puede tener otras restricciones. Para evitar estos problemas, puede reformatear y volver a bloquear los archivos de origen para que se puedan cargar correctamente. Sin embargo, se recomienda que utilice el cargador ETL basado en GDAL, que generalmente no presenta tales problemas ni requisitos.

Como ejemplo, una forma de hacer esto es usar GDAL, una biblioteca de transformación de ráster de código abierto disponible en http://www.gdal.org, para reformatear o volver a bloquear la imagen o el archivo ráster para que JAI (Java Advanced Imaging) pueda manejarlo. GDAL admite GeoRaster de forma nativa y puede importar y exportar objetos GeoRaster directamente, y también puede procesar objetos GeoRaster para obtener más información, consulte http://www.oracle.com/technetwork/database/enterprise-edition/getting-started-with-gdal- 133874.pdf. También puede utilizar GDAL para generar archivos TFW. Por ejemplo, ejecute comandos como los siguientes dos (cada comando en una sola línea) usando la línea de comando GDAL o (para conversión por lotes) shell:

En el ejemplo anterior, el primer comando genera un archivo TFW, cambia el entrelazado a BIP (que es compatible con JAI) y vuelve a bloquear la imagen a 256x256. El segundo comando convierte ECW a TIFF, genera TFW y vuelve a bloquear la imagen.

Luego, use la herramienta de carga de GeoRaster (descrita en Herramientas de GeoRaster: Viewer_ Loader_ Exporter), especificando el rebloqueo para que la imagen se pueda cargar con éxito y luego recuperar de la base de datos de manera eficiente, como en el siguiente ejemplo (un solo comando):

Si recibe un error de "memoria insuficiente" al llamar a SDO_GEOR.importFrom para cargar una imagen muy grande, intente cargar la imagen con un parámetro de tamaño de bloqueo diferente o vuelva a bloquear la imagen en tamaños de mosaico internos más pequeños usando GDAL antes de cargar. Para imágenes extremadamente grandes, también puede usar GDAL para dividir la imagen en varios archivos de imagen más pequeños con tamaños que JAI puede manejar, o usa GDAL para cargar y exportar las imágenes directamente.

3.6 Validación de objetos GeoRaster

Antes de utilizar un objeto GeoRaster o después de editar manualmente los datos ráster y los metadatos de un objeto GeoRaster, debe asegurarse de que el objeto sea válido. La validación de un objeto GeoRaster incluye verificar el registro del objeto GeoRaster, verificar los metadatos y los datos de la celda ráster, y asegurarse de que los metadatos y los datos sean consistentes. Por ejemplo, la validación verifica el tipo de ráster, la información de dimensión y los tamaños reales de los bloques de celdas, y realiza otras verificaciones.

Si utilizó la herramienta de carga de GeoRaster descrita en Herramientas de GeoRaster: Viewer_ Loader_ Exporter, los objetos de GeoRaster se validaron durante la operación de carga.

GeoRaster proporciona los siguientes subprogramas de validación:

SDO_GEOR.validateGeoRaster valida el objeto GeoRaster, incluidos los datos de celda y metadatos. Devuelve TRUE si el objeto es válido; de lo contrario, devuelve uno de los siguientes: un código de error de Oracle que indica por qué el objeto GeoRaster no es válido, FALSE si la validación falla por una razón desconocida o NULL si el objeto GeoRaster es nulo. Siempre debe usar esta función después de crear un objeto GeoRaster.

SDO_GEOR.schemaValidate valida los metadatos con el esquema XML de GeoRaster. Puede utilizar esta función para localizar errores si la función SDO_GEOR.validateGeoRaster devolvió el código de error 13454. Las funciones SDO_GEOR.schemaValidate y SDO_GEOR.validateGeoRaster no validan la geometría de extensión espacial.

SDO_GEOR.validateBlockMBR valida la geometría blockMBR asociada con cada bloque ráster almacenado en la tabla de datos ráster. Si hay geometrías blockMBR no válidas, llame al procedimiento SDO_GEOR.generateBlockMBR para regenerarlas.

3.7 Georreferenciación de objetos GeoRaster

La georreferenciación, como se explica en Georreferenciación, establece la relación entre las coordenadas de celda de los datos de GeoRaster y las coordenadas terrestres del mundo real (o algunas coordenadas locales). Si necesita georreferenciar objetos GeoRaster, los siguientes enfoques están disponibles:

Si la imagen original ya está georreferenciada y si la información de georreferenciación está almacenada en un archivo mundial de ESRI o. rpb que contiene coeficientes RPC, puede usar el procedimiento SDO_GEOR.importFrom para cargar un archivo mundial ESRI o. rpb de un archivo o de un objeto CLOB, junto con los datos de la imagen en sí (en formato FILE o BLOB). También puede usar la herramienta de carga del lado del cliente de GeoRaster (descrita en Herramientas de GeoRaster: Viewer_ Loader_ Exporter) para cargar un archivo mundial de ESRI o. rpb de un archivo, junto con el archivo de imagen en sí.

Porque un archivo mundial de ESRI o. rpb no especifica el sistema de coordenadas del modelo, puede establecer el espacio modelo del objeto GeoRaster georreferenciado utilizando un SRID de Oracle de cualquiera de las siguientes formas: especifique el SRID junto con el archivo mundial como parámetro para el procedimiento SDO_GEOR.importFrom o el cargador del lado del cliente de GeoRaster (descrito en Herramientas de GeoRaster: Viewer_ Loader_ Exporter) o, después de cargar el archivo mundial, llame al procedimiento SDO_GEOR.setModelSRID. También puede llamar al procedimiento SDO_GEOR.setModelSRID para cambiar el espacio modelo de un objeto GeoRaster georreferenciado.

Si la imagen original es una imagen GeoTIFF georreferenciada, puede utilizar el procedimiento SDO_GEOR.importFrom para cargar la imagen con georreferenciación, especificando GEOTIFF como formato de entrada. Para cargar solo la información de georreferenciación de una imagen GeoTIFF, sin los datos de la imagen ráster, en un objeto GeoRaster existente, agregue el parámetro de almacenamiento raster = false. Puede especificar un SRID de respaldo con el parámetro de almacenamiento srid, en caso de que los valores de configuración de GeoTIFF no coincidan con ningún SRID reconocido por Oracle Spatial.

El espacio ráster GeoTIFF PixelIsArea es equivalente al sistema de coordenadas de celda basado en la parte superior izquierda de GeoRaster. Una exportación a GeoTiff siempre se realiza en el espacio ráster PixelIsArea, con un ajuste de medio píxel de la transformación afín si el objeto GeoRaster está en un sistema de coordenadas de celda basado en el centro. Una importación de GeoTIFF es siempre al sistema de coordenadas de celda basado en el centro de GeoRaster, con un ajuste de medio píxel de la transformación afín si el archivo GeoTIFF se especifica en el espacio ráster PixelIsArea.

También puede usar la herramienta de carga del lado del cliente de GeoRaster (descrita en Herramientas de GeoRaster: Viewer_ Loader_ Exporter) para cargar imágenes GeoTIFF con georreferenciación, usando el parámetro de almacenamiento geotiff = true. Si omite este parámetro o especifica geotiff = false, la imagen se carga como una imagen TIFF simple sin georreferenciación. Los parámetros de almacenamiento ráster y srid también se aplican a la herramienta de carga del lado del cliente.

Para cargar o exportar imágenes GeoTIFF con las herramientas del lado del cliente de GeoRaster, agregue las siguientes bibliotecas GeoTIFF a su definición de CLASSPATH:

xtiff-jai.jar (disponible en el grupo SourceForge Extensible-TIFF-JAI)

geotiff-jai.jar (disponible en el grupo SourceForge GeoTIFF-JAI)

Para cargar o exportar imágenes GeoTIFF con el procedimiento SDO_GEOR.importFrom o SDO_GEOR.exportTo, cargue estas bibliotecas en el esquema MDSYS usando $ ORACLE_HOME / rdbms / admin / catcon.pl. Edite $ ORACLE_HOME / md / admin / sdoldgtf.sql según sea necesario para reflejar las rutas de los archivos xtiff-jai.jar y geotiff-jai.jar. Luego ingrese los siguientes comandos:

Si la base de datos se degrada a una versión anterior a Oracle Database 11 g, estas bibliotecas deben desinstalarse de acuerdo con el script en $ ORACLE_HOME /md/admin/sdormgtf.sql, editándolo según sea necesario para reflejar las rutas al xtiff-jai.jar y geotiff-jai.jar, y ejecutando el script sdormgtf.sql o ingresando los siguientes comandos:

Puede utilizar el procedimiento SDO_GEOR.setSRS para agregar, modificar y eliminar información de georreferenciación accediendo directamente a los metadatos de GeoRaster SRS. Por ejemplo, puede crear un objeto SDO_GEOR_SRS y asignar los coeficientes y la información de georreferenciación relacionada, y luego llamar al procedimiento SDO_GEOR.setSRS para agregar o actualizar la información de referencia espacial de cualquier objeto GeoRaster. Puede utilizar el procedimiento SDO_GEOR.setSRS para configurar la información de referencia espacial para todos los modelos de georreferenciación de ajuste funcional admitidos. En la sección de referencia del procedimiento SDO_GEOR.setSRS se incluyen ejemplos de cómo configurar la información SRS de un modelo DLT existente y de un modelo RPC existente.

Si sabe que un objeto GeoRaster tiene la misma información SRS que otro objeto GeoRaster, puede llamar a la función SDO_GEOR.getSRS para recuperar un objeto SDO_GEOR_SRS de este objeto GeoRaster y luego llamar al procedimiento SDO_GEOR.setSRS para georreferenciar el primer objeto GeoRaster.

Si el objeto GeoRaster se puede georreferenciar usando una transformación afín, puede llamar al procedimiento SDO_GEOR.georeference para georreferenciar un objeto GeoRaster directamente. Como se describe en la información de referencia para la georreferencia SDO_GEOR., Este procedimiento toma los coeficientes A, B, C, D, E, F y otra información, los convierte en los coeficientes a, b, c, d, e, f y los almacena en la información de referencia espacial de un objeto GeoRaster. Si los datos ráster originales se rectifican y si la coordenada del modelo de su origen (esquina superior izquierda) es (x0, y0) y su resolución espacial o escala es s, entonces se cumple lo siguiente: A = s, B = 0, C = x0, D = 0, E = -s, F = y0.

Si tiene puntos de control terrestre (GCP) o desea recopilar GCP usted mismo, puede llamar a la función SDO_GEOR.georeference para georreferenciar el objeto GeoRaster. Para obtener más información, consulte Georreferenciación avanzada.

Según la información SRS de un objeto GeoRaster georreferenciado, transformar la información de coordenadas de GeoRaster significa encontrar la coordenada del modelo (suelo) asociada con una coordenada de celda específica (ráster) y lo contrario. Es decir, puede hacer lo siguiente:


¿Creando una base de datos espacial con muchas categorías que tienen el mismo conjunto de valores? - Sistemas de Información Geográfica

UNIDAD 44 - CONCEPTOS DE BASE DE DATOS II

Compilado con la ayuda de Gerald White, Universidad Estatal de California, Sacramento

UNIDAD 44 - CONCEPTOS DE BASE DE DATOS II

Compilado con la ayuda de Gerald White, Universidad Estatal de California, Sacramento

    configurar y mantener una base de datos espacial requiere una planificación cuidadosa, atención a numerosos problemas

  • muchos problemas de bases de datos, como la seguridad, no se consideran importantes en muchos de los primeros SIG
  • difícil de crecer en un entorno de grandes sistemas orientados a la producción

    Se encuentran muchos tipos de datos diferentes en los datos geográficos, p. ej. imágenes, palabras, coordenadas, objetos complejos

  • p.ej. Las descripciones de suelos en la leyenda de un mapa de suelos pueden llegar a cientos de palabras.
  • p.ej. Las descripciones son tan importantes como los datos numéricos para definir las líneas de propiedad en la topografía: descripciones de "medidas y límites".

  • p.ej. el número de coordenadas en una línea puede variar
  • Esta es la razón principal por la que algunos diseñadores de SIG han optado por no utilizar soluciones de bases de datos estándar para datos de coordenadas, solo para tablas de atributos.

  • En los datos geográficos, las posiciones de los objetos establecen un orden implícito que es importante en muchas operaciones.
    • a menudo es necesario trabajar con objetos adyacentes en el espacio, por lo que es útil tener estos objetos adyacentes o cercanos en la base de datos
    • es un problema con los sistemas de bases de datos estándar, ya que no permiten enlaces entre objetos en el mismo tipo de registro (clase)

    geometría de los objetos, p. ej. existencia de separación de grados en el cruce de la calle

    • p.ej. los arcos que forman un polígono deben unirse en un límite completo
    • p.ej. las líneas no se pueden cruzar sin formar un nodo

    • p.ej. El usuario puede necesitar ser consciente de que los polígonos están compuestos de arcos y almacenados como registros de arco, no pueden tratarlos simplemente como objetos y dejar que el sistema se encargue de la estructura interna.
    • Los usuarios deben tener demasiado conocimiento del modelo de base de datos, no pueden concentrarse en el conocimiento del problema.
    • los usuarios pueden tener que usar comandos complejos para ejecutar procesos que son conceptualmente simples

    • el modelo relacional captura la realidad geográfica a través de un conjunto de tablas (relaciones) enlazadas por claves (campos o atributos comunes)
      • cada tabla contiene un conjunto de registros (tuplas)
      • las tablas están normalizadas para minimizar la redundancia de información, maximizar la integridad

      • cada tabla corresponde a un conjunto de características del mundo real con tipos comunes de atributos
      • el usuario necesita saber qué características se almacenan en qué tablas

      • muchas implementaciones (por ejemplo, ARC / INFO) almacenan solo las tablas de atributos en el modelo relacional, ya que es menos sencillo almacenar las descripciones geométricas de los objetos; tales sistemas se han llamado "híbridos"
      • la mayoría de las operaciones espaciales no forman parte del lenguaje de consulta estándar de los RDBMS, p. ej. encontrar objetos dentro de un polígono definido por el usuario, p. ej. superposición, p. ej. generación de zona de amortiguamiento
      • el modelo relacional no maneja fácil y eficientemente el concepto de objetos complejos (objetos formados por la agregación de objetos simples) - este concepto es más compatible con el modelo de datos jerárquico

        Muchos sistemas para computadoras pequeñas y sistemas especializados en datos geométricos y geográficos no brindan la funcionalidad necesaria para mantener la integridad de los datos durante largos períodos de tiempo.

      • Las restricciones de integridad son reglas que la base de datos debe obedecer para ser significativa.
        • los valores de los atributos deben estar dentro de los dominios prescritos
        • las relaciones entre objetos no deben entrar en conflicto, p. ej. La relación "fluye hacia" entre los segmentos del río debe coincidir con la relación "es alimentado por"
        • Los datos de ubicación no deben violar las reglas de aplicación plana, los contornos no deben cruzarse, etc.

        • las transacciones pueden incluir:
          • modificaciones a elementos de datos individuales
          • adición o eliminación de registros completos

            p.ej. adición de nuevas tablas o relaciones, redefinición de claves de acceso

            en muchos casos, más de un usuario necesitará acceder a la base de datos al mismo tiempo.
              esta es una gran ventaja de los sistemas y redes multiusuario

            • p.ej. el usuario B puede cambiar un objeto mientras el usuario A lo está procesando
              • los resultados no serán válidos ni para la versión antigua ni para la nueva del objeto

                desprotegido: las aplicaciones pueden recuperarse y modificarse al mismo tiempo

                En la práctica, ningún sistema permite esto, pero si lo hiciera, el sistema debería proporcionar una advertencia de que otros usuarios están accediendo a los datos.

                p.ej. el usuario B debe poder consultar el estado de los camiones de bomberos incluso después de que el usuario A haya puesto una "espera" en uno

              • En las aplicaciones GIS, la digitalización y actualización de objetos espaciales puede requerir un trabajo intensivo en una parte de la base de datos durante largos períodos de tiempo.
                • p.ej. El operador del digitalizador puede pasar un turno completo trabajando en una hoja de mapa.
                • Es probable que el trabajo se realice en una estación de trabajo que funcione independientemente de la base de datos principal.

                • Esto permitirá a otros usuarios leer los datos, pero no verificarlos ellos mismos para modificarlos.
                • esto resuelve los problemas que pueden ocurrir
                • p.ej. el usuario A extrae una hoja a las 8:00 am y comienza a actualizar
                  • el usuario B revisa la misma hoja a las 9:00 am e inicia un conjunto diferente de actualizaciones desde la misma base
                  • Si a ambos se les permite posteriormente volver a registrar la hoja, entonces el segundo registro puede intentar modificar un objeto que ya no existe.

                    ¿Cuántos datos deben bloquearse durante una transacción?

                  • cambiar un elemento también puede requerir otros cambios, p. ej. en índices
                  • en principio, todos los datos que puedan verse afectados por una transacción deben bloquearse
                  • puede ser difícil determinar el alcance de los posibles cambios

                  • el usuario está modificando una hoja de mapa
                  • Debido a que los objetos de la hoja tienen "bordes coincidentes" con los objetos de hojas adyacentes, el contenido de las hojas adyacentes también puede verse afectado.
                    • p.ej. Si se elimina una línea de ferrocarril que se extiende hasta el borde de la hoja de mapa, ¿debería verse afectada su continuación en la hoja siguiente? De lo contrario, la base de datos ya no se emparejará de manera efectiva.
                    • nivel de base de datos completo
                    • nivel de "vista"
                      • bloquear solo aquellas partes de la base de datos que sean relevantes para la vista de la aplicación
                      • bloquear una relación completa o tabla de atributos
                      • bloquear un solo registro

                        es cuando una solicitud no puede continuar procesándose

                      • la solicitud A ahora solicita el recurso 2, B solicita el recurso 1
                      • A y B se esperarán el uno al otro a menos que haya una intervención.

                      • el usuario B ahora intenta un pago: algunos de los contenidos del área solicitada ya han sido bloqueados por A
                      • por lo tanto, el sistema debe desbloquear todas las solicitudes de B y comenzar de nuevo; B esperará hasta que A termine

                        el costo de crear bases de datos espaciales es muy alto, por lo que la inversión debe protegerse contra pérdidas
                          la pérdida puede ocurrir debido a fallas de hardware o software

                          todas las transacciones desde la última copia de seguridad deben guardarse en caso de que la base de datos deba regenerarse
                            Las transacciones no confirmadas pueden perderse, pero las confirmadas deben guardarse.

                          • interrupción del sistema de administración de la base de datos debido a errores operativos, fallas del sistema operativo o hardware, o fallas de energía
                            • Estas interrupciones ocurren con frecuencia, una vez al día o una vez a la semana.
                            • el contenido de la memoria principal se pierde, el sistema debe "reiniciarse"
                            • el contenido de la base de datos en el dispositivo de almacenamiento masivo generalmente no se ve afectado

                              algunos datos GIS son confidenciales o secretos, p. ej. registros de impuestos, listas de clientes, datos de rendimiento de la tienda minorista

                              p.ej. Infecciones por "virus" transmitidas a través de las redes de comunicación.

                            • evitar que usuarios no autorizados accedan a la base de datos, una función del sistema operativo
                            • limitar el acceso a ciertas partes de la base de datos
                              • p.ej. Los usuarios del censo pueden acceder a los recuentos basados ​​en el censo, pero no a los cuestionarios individuales del censo (nota: Suecia permite el acceso a las declaraciones individuales).

                                La flexibilidad, la complejidad de muchas aplicaciones SIG a menudo dificultan proporcionar la seguridad adecuada.

                              Textos de bases de datos estándar enumerados en la unidad 43

                              Abel, D.J., 1989. "SIRO-DBMS: un conjunto de herramientas de base de datos para sistemas de información geográfica", Revista Internacional de Sistemas de Información Geográfica 3: 103-116. Una extensión del modelo relacional para datos espaciales.

                              Frank, A.U., 1984. "Requisitos para sistemas de bases de datos adecuados para gestionar grandes bases de datos espaciales", Actas, Simposio internacional sobre manipulación de datos espaciales, Universidad de Zúrich, págs. 38-60.

                              Nyerges, T.L., 1989. "Análisis de integración de esquemas para el desarrollo de bases de datos SIG", Revista Internacional de Sistemas de Información Geográfica 3: 153-184. Analiza los procedimientos formales para comparar y fusionar esquemas de bases de datos espaciales.

                              1. ¿En qué se diferencian los problemas de las bases de datos de los SIG de los de las bases de datos en general?

                              2. ¿Qué se entiende por integridad de datos en una base de datos espacial? Dar ejemplos.

                              3. Dé ejemplos de las formas en que la integridad de una base de datos espacial puede degradarse sin los controles de acceso adecuados.

                              4. Examine los controles de acceso a la base de datos que existen en cualquier SIG al que tenga acceso.¿Serían adecuados para una gran aplicación de agencia orientada a la producción?


                              Envíe sus comentarios sobre el contenido a: Brian Klinkenberg
                              Envíe sus comentarios sobre los problemas del sitio web a: The Techmaster
                              Última actualización: 30 de agosto de 1997.


                              Usando SQLite / Spatialite¶

                              Instalación¶

                              Instalación de Spatialite¶

                              Spatialite requiere las bibliotecas GEOS y PROJ4, que en la mayoría de los casos ya habrás instalado junto con PostGIS:

                              Spatialite espera libgeos 3.1.1, pero también se puede usar con cualquier versión 3.0.x. Solo tienes que crear un enlace simbólico:

                              Ahora descargue la biblioteca de Spatialite precompilada libspatialite desde la página de descarga de Spatialite y descomprima el archivo para / usr / local / lib / libspatialite o en una carpeta de su conveniencia:

                              En Ubuntu 9.10+ puede instalar la biblioteca Spatialite como paquete libspatialite2 directamente desde los repositorios.

                              Las bibliotecas precompiladas para Spatialite solo funcionan en sistemas de 32 bits, si está utilizando un sistema de 64 bits, tendrá que compilarlas usted mismo. Para hacerlo, descargue el código fuente de libspatialite-amalgamation del sitio web de Spatialite. Asegúrate de haber instalado también el paquete. libgeos-dev . Descomprima el archivo fuente y compile usando los siguientes comandos (es posible que desee cambiar el prefijo ruta, la biblioteca compilada se copiará allí):

                              Si recibe el mensaje de error no se puede encontrar -lstdc ++ , es posible que deba crear un enlace simbólico para esta biblioteca:

                              Más información sobre la compilación libspatialite se puede encontrar aquí: Cómo construir libspatialite.

                              Instalación de pysqlite2¶

                              Aunque Python 2.5+ contiene el controlador SQLite pysqlite2, debe compilarlo usted mismo. La biblioteca Spatialite se usa en SQLite como extensión y, por defecto, la carga de extensiones externas está deshabilitada en pysqlite2.

                              Compilar pysqlite2 tendrá que instalar los archivos de encabezado SQLite:

                              Descargar el pysqlite2 código fuente de pysqlite2: descargue y descomprímalo en su entorno virtual MapFish.

                              Luego abre el archivo setup.cfg y comenta la línea define = SQLITE_OMIT_LOAD_EXTENSION :

                              Ahora puede compilar y configurar pysqlite2 con:

                              Si te encuentras con Fallo de segmentación errores al usar esta compilación, puede intentar hacer un construcción estática . Esto descargará el último archivo de fusión SQLite3 y lo vinculará internamente:

                              Configurando una base de datos habilitada espacialmente¶

                              La creación de una base de datos se puede hacer usando espacialita-gui o usando el cliente CLI espacialita . A continuación usaremos espacialita , pero también puedes usar espacialita-gui para ejecutar los comandos.

                              Puedes obtener espacialita-gui desde el sitio web de Spatialite, también eche un vistazo a la guía rápida para Spatialite-gui (PDF).

                              Primero tienes que descargar el paquete herramientas-espacialitas de Spatialite Downloads y el script init_spatialite-2.3.sql de Spatialite Ressources. Los scripts crean el geometry_columns y space_ref_sys tablas de metadatos y también inserta una colección de sistemas de referencia espacial.

                              Inicie el cliente Spatialite llamando a:

                              Esto creará el archivo gis.sqlite , si aún no existe. Luego ejecuta el script init_spatialite-2.3.sql :

                              Ahora puede crear una tabla con una columna de geometría. Esto se hace en dos pasos: primero creamos una tabla SQLite simple sin la columna de geometría, y luego agregamos la columna de geometría usando la función AddGeometryColumn ():

                              También puede crear una tabla a partir de un Shapefile con .loadshp (vea también Crear una nueva base de datos SpatiaLite y completarla):

                              E incluso puede ejecutar consultas directamente en Shapefiles sin copiar los datos en una tabla (consulte también Realización de consultas SQL directamente en shapefiles):

                              Actualmente solo se admiten operaciones de lectura, pero aún así mesas virtuales son una buena opción para publicar un Shapefile con MapFish.

                              Configuración¶

                              Cuando usas espacialita-gui y espacialita la biblioteca Spatialite se carga automáticamente como extensión. Pero cuando se conecta a una base de datos Spatialite usando un controlador SQLite ordinario, debe cargar la biblioteca Spatialite manualmente.

                              En MapFish, las conexiones a la base de datos son administradas por SQLAlchemy. Cada vez que SQLAlchemy abre una nueva conexión a una base de datos de Spatalite, se debe cargar la biblioteca de Spatialite. Esto se puede hacer configurando un PoolListener.

                              Abre el archivo modelo / __ init__.py y modificar el método init_model (motor) , para que se vea así:

                              Ahora solo tiene que establecer la cadena de conexión de la base de datos en el archivo de configuración de su aplicación MapFish (por ejemplo desarrollo.ini ) reemplazando la línea:

                              El número de barras a la derecha de sqlite: depende de si está utilizando una ruta relativa o absoluta, consulte también SQLite: Connect Strings.


                              ¿Creando una base de datos espacial con muchas categorías que tienen el mismo conjunto de valores? - Sistemas de Información Geográfica

                              La base de datos de diversidad natural de California

                              Un modelo espacial para catalogar la biodiversidad

                              Resumen: La & quot; Metodología del patrimonio & quot de The Nature Conservancy, utilizada en América del Norte y del Sur por el Programa de Patrimonio y los Centros de Datos de Conservación afiliados, se ha convertido en un método estándar para catalogar la biodiversidad. Esta metodología proporciona herramientas y pautas para almacenar información cualitativa y de ubicación sobre especies sensibles de plantas y animales y comunidades naturales. Aunque la información tiene un componente espacial muy fuerte, las complicaciones involucradas en la definición y el almacenamiento de conjuntos de datos biológicos han hecho que el desarrollo de modelos espaciales para manejar y analizar esta información sea lento y descoordinado. Sin embargo, con el énfasis cada vez mayor en la planificación biorregional, la necesidad de aplicar herramientas de análisis espacial flexibles a un nivel amplio ha impulsado la búsqueda de un modelo de datos geoespaciales adecuado.

                              Solución SIG: En el modelo Heritage, un & quot; ocurrencia de elemento de cotización & quot se ha definido durante mucho tiempo como una herramienta de gestión de datos, o abstracción, que describe una población existente o histórica, parte de una población, un pequeño grupo de poblaciones o una comunidad natural. La ocurrencia de un elemento representa más comúnmente, pero no se limita a, taxones o comunidades naturales raros, amenazados y / o en peligro de extinción. Estos registros contienen varios atributos, tanto espaciales como espaciales. En el modelo anterior a SIG, los atributos espaciales consistían en un centro (latitud y longitud) y un radio (precisión) a su alrededor, lo que indica la precisión con la que se ha cartografiado la característica. Esta combinación de centro y radio de confianza definió la ubicación y extensión de la ocurrencia del elemento. El hecho de que muchas de estas características espaciales se superpusieran entre sí complicó enormemente el desarrollo de las representaciones SIG. La Base de Datos de Diversidad Natural de California (CNDDB), el Programa de Herencia de California, ha utilizado la clase de entidad ArcInfo & quotregion & quot recientemente introducida para diseñar e implementar un nuevo modelo espacial que antes no era posible.

                              Metodología: El modelo CNDDB permite que la ocurrencia de un elemento retratado en un sistema de información geográfica sea representada por una característica espacial con extensión de área, en oposición a un punto o línea. Para representar con precisión las situaciones biológicas complejas inherentes al modelo de ocurrencia de elementos del Patrimonio Natural, estas características son:

                              & # 183 Capaz de superponerse con otras funciones sin perder su identidad única.

                              & # 183 Capaz de contener huecos o & quot; agujeros de nuez & quot.

                              & # 183 Capaz de representar situaciones complejas que contienen varios componentes espaciales, o partes, sin dejar de ser considerado una sola ocurrencia.

                              & # 183 Capaz de representar simultáneamente la ubicación de varias ocurrencias de elementos que comparten la misma ubicación geográfica.

                              Software: Se ha desarrollado una aplicación ArcInfo Forms para estandarizar y automatizar parcialmente el proceso de ingresar, editar y consultar ocurrencias de elementos y la automatización de la creación de subconjuntos. El modelo espacial fue diseñado de tal manera que permita su uso tanto en clientes ArcInfo como en ArcView.

                              Este artículo discutirá, en detalle, las justificaciones biológicas y geográficas del modelo espacial, y algunos de los aspectos técnicos involucrados en el desarrollo de la aplicación que lo sustenta y lo hace cumplir.

                              Un registro de ocurrencia de elementos (EOR) es la unidad de almacenamiento central empleada en la base de datos de conservación biológica (BCD) utilizada por la mayoría de los programas de Heritage para almacenar información sobre ocurrencias de elementos. Junto con muchos otros atributos, a cada registro para la ocurrencia de un elemento se le asigna un componente espacial (aunque en un sentido tabular aspacial) con un centro (latitud y longitud) y un radio (precisión) a su alrededor que indica con qué precisión se ha mapeado la característica. Esta combinación de centro y radio de confianza define la ubicación de la ocurrencia del elemento.

                              El modelo SIG presentado aquí no busca suplantar esta metodología probada en el tiempo. Más bien, el objetivo es comenzar con este concepto y actualizar el modelo para permitirle aprovechar al máximo la tecnología GIS. La necesidad de poder seleccionar, comparar o analizar las ocurrencias de los elementos en función de sus características espaciales es la fuerza impulsora detrás de este esfuerzo.

                              No es la intención de este documento resolver cuestiones básicas relacionadas con la definición de & quot; ocurrencia de cotización & quot. Este esfuerzo continuo está siendo abordado por el Comité de Diseño de Ocurrencias de Elementos de The Nature Conservancy. Sin embargo, para los propósitos de este modelo, la ocurrencia de un elemento se ha definido como una herramienta de administración de datos, o abstracción y no como una característica física en el terreno (conocida por algunos programas como & quotEOR & quot, o registro de ocurrencia de un elemento, consulte la definición a continuación). .

                              Además, no permita que la confusión sobre el uso de los términos exactitud y precisión utilizados para describir qué tan cerca se ha asignado una característica a su ubicación real en el mundo real se convierta en un problema. El significado pretendido de los términos debe quedar claro en el contexto de este documento.

                              I) La ocurrencia de un elemento (EO) es una herramienta de gestión de datos, o abstracción, que describe una población existente o histórica, parte de una población, un pequeño grupo de poblaciones o una comunidad natural. La ocurrencia de un elemento tiene componentes espaciales y tabulares, representados por una característica mapeable y su registro de base de datos de soporte. La ocurrencia de un elemento representa más comúnmente, pero no se limita a, taxones o comunidades naturales raros, amenazados y / o en peligro de extinción.

                              II) La ocurrencia de un elemento representado en un sistema de información geográfica debe estar representado por una característica espacial con extensión de área, en oposición a un punto o una línea. Para poder representar con precisión las situaciones complejas inherentes al modelo de ocurrencia de elementos del Patrimonio Natural, estas características deben:

                              & # 183 Ser capaz de superponerse con otras funciones sin perder su identidad única.

                              & # 183 Ser capaz de contener huecos o & quot; agujeros de nuez & quot.

                              & # 183 Ser capaz de representar situaciones complejas que contengan varios componentes espaciales, o partes, sin dejar de ser considerado una sola ocurrencia.

                              & # 183 Ser capaz de representar simultáneamente la ubicación de varias ocurrencias de elementos que comparten la misma ubicación geográfica.

                              Nota: Esto requerirá el uso de un modelo de software que permitirá estas situaciones. La clase de entidad de las regiones de ArcInfo o el objeto ArcView como contenido en un shapefile cumple con estos requisitos. Los modelos de software adicionales también pueden cumplir.

                              III) Las características espaciales de ocurrencia de elementos deben representar la extensión geográfica completa, o huella, sobre la cual se puede decir que la ocurrencia tiene una posible influencia.

                              Esto implica que la característica espacial almacenada en un SIG representa no solo un punto o una línea, sino una esfera de influencia alrededor de esas características simples. El tamaño y la forma de esta huella se basan en la precisión con la que se puede ubicar la ocurrencia o en otras consideraciones biológicas, ecológicas o geográficas. Por tanto, esta esfera de influencia es el resultado de la combinación de varios posibles componentes de apoyo:

                              Las entidades fuente representan cartográficamente situaciones del mundo real y actúan como fuente mapeable para la ocurrencia de un elemento. Las entidades de origen pueden ser puntos, líneas o áreas y pertenecen a uno de los dos tipos de precisión específicos o no específicos.

                              & # 183 Las características de origen específicas son aquellas que representan con precisión la ubicación y extensión de la ocurrencia de un elemento.

                              & # 183 Las características de origen no específicas son aquellas que representan aproximadamente la ubicación y extensión de la ocurrencia de un elemento.

                              Nota: Debido a que una característica espacial de ocurrencia de un elemento debe representar la extensión geográfica completa, o huella, sobre la cual se puede decir que la ocurrencia tiene una posible influencia, el tamaño físico de una característica de fuente no específica será típicamente mayor que el de una característica específica. característica de la fuente. Este efecto se ve moderado por el hecho de que las características de la fuente no específicas se pueden ponderar de manera diferente para fines de análisis debido a su menor precisión espacial (consulte la discusión sobre la clase de precisión en la página 9).

                              Puntos . Información de fuente descriptiva o mapeada que vincula una ocurrencia a una ubicación discreta de coordenadas x, y.

                              & # 183 Una característica de fuente puntual específica sería una ubicación de coordenadas de alta precisión, como características mapeadas con precisión o coordenadas GPS.

                              & # 183 Una característica de fuente puntual no específica sería una aproximación descriptiva vaga, como una sección.

                              Las ocurrencias de precisión S, M y G (como se definen y usan en el BCD) son ejemplos de características de fuente puntual.

                              Líneas . Información de origen descriptiva o cartografiada que vincula un suceso a una línea, como un arroyo, canal, cañón o carretera.

                              & # 183 Una característica de fuente de línea específica representaría un segmento de línea particular (o segmentos) mostrado como una sola línea en un mapa, o una descripción narrativa detallada que vincula la ocurrencia a una característica en un mapa o una fuente de datos geoespaciales.

                              & # 183 Una característica de fuente de línea no específica describiría lo mismo que el anterior en situaciones en las que se desconoce la posición exacta de la ocurrencia. No específico, en este caso, no implica que la ubicación física de los segmentos lineales esté en cuestión, sino más bien que la posición de la ocurrencia a lo largo de esos segmentos es incierta. En este caso, sería apropiado incluir todos los segmentos probables en la ocurrencia.

                              Nota: En situaciones en las que la ubicación física de los segmentos de línea está en duda (por ejemplo, cuando no hay entidades mapeadas disponibles o solo se proporciona información de ubicación vaga), la ocurrencia del elemento se representaría mejor mediante el uso de una entidad fuente de área no específica ( vea abajo).

                              Actualmente, las entidades de línea no se representan como tales mediante BCD.

                              Áreas. Información de fuente descriptiva o mapeada que vincula una ocurrencia a una característica de área.

                              & # 183 Un elemento de origen de un área específica sería un lago, un pantano, un elemento de arroyo representado como una línea doble en un mapa, un grupo de vegetación o cualquier otra área de forma regular o irregular reconocible como tal en un mapa o en los materiales de origen proporcionados. de la escala a la que se estandariza todo el conjunto de datos.

                              & # 183 Una característica de fuente de área no específica generalmente podría describirse como un límite general que abarca un área de hábitat ocupado o adecuado para la presencia de un elemento para el cual se desconoce un límite exacto.

                              Actualmente, las entidades de área no se representan como tales mediante BCD.

                              Debe recordarse que la representación de la ubicación, extensión y, hasta cierto punto, la precisión de la ocurrencia de un elemento es la función principal de la característica fuente, no el búfer. El búfer es simplemente una herramienta que se usa en conjunto con la característica fuente para asegurar que todas las ocurrencias de elementos se ajustan al modelo GIS al estar compuesta por características espaciales con extensión de área que representan la esfera de influencia o "huella" de la ocurrencia.

                              Los búferes también pueden permitir un método abreviado para crear características espaciales en ciertas situaciones en las que se puede estandarizar un conjunto de requisitos biológicos (ver ejemplos a continuación).

                              Se aplica a: características puntuales específicas y características de fuente de línea específicas o no específicas (obligatorio).

                              La característica del paisaje que representan estos tipos de características de origen tiene una extensión real (una longitud y un ancho) aunque pueda aparecer como un punto o una línea en un mapa. Debido a que nuestro conjunto de datos contiene, por definición, solo entidades con extensión de área, se debe agregar una zona de influencia al punto o línea para crear dicha entidad. La cantidad de este búfer se establece de manera procedimental a la cantidad a la distancia mapeable mínima para la escala del conjunto de datos (en el caso de California, un radio de 80 metros).

                              No se aplica a: entidades puntuales no específicas y entidades de origen de área específicas o no específicas.

                              El almacenamiento en búfer de procedimiento no está permitido para entidades de puntos no específicas. Al ser más generales en su ubicación, estas características ya serán más grandes que la unidad mapeable mínima.

                              El almacenamiento en búfer de procedimiento no está permitido para ninguna entidad de área porque se presume que una entidad de área es lo suficientemente grande como para no requerirla (las áreas más pequeñas que la unidad mapeable mínima deben mapearse como entidades de fuente puntual específicas).

                              Ejemplos de ocurrencias que utilizan búferes de procedimiento:

                              & THORN Un nido de halcón de Swainson ubicado con precisión.

                              & THORN Cualquier ocurrencia de plantas que represente una pequeña población restringida mapeada en un lugar conocido.

                              & THORN Trucha degollada de Lahontan observada en un tramo o segmento de arroyo conocido.

                              & THORN Información que vincula las observaciones de esculturas aproximadas con uno o más puntos inciertos en un arroyo, sin barreras significativas al movimiento que los dividan. Se incluirían todos los segmentos probables y los que los conectan.

                              & THORN Winter corra salmón chinook en un sistema de arroyos conocido pero segmentos desconocidos. Se incluirían todos los segmentos de la corriente.

                              & THORN Cactus de Bakersfield a lo largo de un segmento incierto de un acueducto conocido.

                              Se aplica a: características de fuente puntual específicas, características de fuente de línea específicas o no específicas y a características de fuente de área específicas (opcional).

                              Un tampón biológicamente indicado se utiliza en situaciones en las que ciertas consideraciones biológicas basadas en las circunstancias de esa ocurrencia o las pautas contenidas en las especificaciones de ocurrencia del elemento para ese elemento indican su uso. Los tampones biológicamente indicados se utilizan con poca frecuencia.

                              No se aplica a: entidades puntuales no específicas y entidades de origen de área no específicas.

                              El almacenamiento en búfer biológico no está permitido para características puntuales no específicas o características de fuente de área no específicas porque su ubicación general hace que el almacenamiento en búfer detallado no tenga sentido

                              Ejemplos de ocurrencias que utilizan tampones biológicamente indicados:

                              & THORN Una ocurrencia de azor generada mediante el uso de una zona de amortiguamiento de 200 metros alrededor de un nido para abarcar el área de alimentación.

                              & THORN Una ocurrencia de tortuga de estanque generada al almacenar en búfer la ubicación de un arroyo mapeado para abarcar una distancia de 150 metros desde el arroyo para incluir nidos.

                              & THORN Una ocurrencia de la cola dividida de Sacramento usando un amortiguador de 100 metros en un arroyo para tomar en consideración el hecho de que el pez desova entre plantas costeras inundadas en marea alta.

                              & THORN Ocurrencia de una planta en un cañón en la isla Santa Rosa, amortiguada para incluir las laderas superiores del cañón para dar cuenta del hecho de que se sabe que esta planta ocurre hasta una altura de 300 metros. Aunque se conoce la ubicación del cañón, no se conoce la ubicación exacta en el cañón.

                              & THORN Una ocurrencia de aves acuáticas generada al amortiguar un lago para abarcar el lago y un área de costa de 100 metros.

                              Se aplica a: solo características de fuente puntual no específicas (obligatorio).

                              El búfer indicado de precisión espacial representa, en una distancia lineal (metros, pies, etc., dependiendo de los parámetros de la proyección geográfica utilizada por el programa), la precisión posicional de la ocurrencia del elemento (esto no intenta abordar problemas relacionados con la precisión del mapa, escala o proyección geográfica). Esto se incluirá como un búfer físico alrededor de la característica de la fuente que representa su precisión como más o menos una distancia determinada. Las precisiones S, M y G del BCD esencialmente registran la precisión espacial de una manera muy aproximada y limitante. Sería mejor para esta distancia de amortiguación permitir que cada programa de Heritage determine los incrementos para adaptarse mejor a la biología de los elementos que están rastreando o los métodos de mapeo que se utilizan (consulte el ejemplo de California de clase de precisión en la página 9).

                              No se aplica a: Cualquier otro tipo de función de origen.

                              Las zonas de influencia de precisión espacial no están permitidas para entidades de origen puntual específicas o cualquier entidad de fuente de línea o área porque se supone que su precisión espacial es la misma que para todas las demás entidades de la misma fuente de datos y está implícita en el mapa.

                              Ejemplos de ocurrencias que utilizan búferes indicados con precisión espacial:

                              & THORN Una ocurrencia de planta creada usando información de una etiqueta de herbario que ubica la planta en una ubicación vaga, como una ciudad.

                              Los efectos de los búferes varían según el tipo de entidad de origen:

                              Las características específicas de la fuente puntual utilizan un búfer de procedimiento requerido con un búfer biológico opcional. En los casos en los que se usa un tampón biológico y excede la cantidad de tampón de procedimiento, la cantidad total de tampón es igual al tampón biológico solo, no a una combinación de los dos. El uso de un búfer biológico reemplaza así la necesidad de un búfer de procedimiento. Esto daría como resultado características de ocurrencia de elementos circulares con un radio igual a la unidad mapeable mínima o el búfer biológico.

                              Las entidades de fuente puntual no específicas utilizan un búfer de precisión espacial requerido y dan como resultado entidades de ocurrencia de elementos circulares con un radio igual al búfer de precisión espacial, disminuyendo su precisión a medida que aumentan de tamaño.

                              Las características específicas de la fuente de línea utilizan un búfer de procedimiento requerido con un búfer biológico opcional. De manera similar a las características específicas de la fuente puntual, en los casos en que se usa un tampón biológico y la cantidad de tampón excede la cantidad de tampón de procedimiento, la cantidad de tampón total es igual al tampón biológico solo, no a una combinación de los dos. Esto daría como resultado una ocurrencia de elemento con extensión espacial pero apariencia lineal (si se parece a una salchicha).

                              Las características de fuente de línea no específicas utilizan un búfer de procedimiento requerido con un búfer biológico opcional y dan como resultado características similares en apariencia a características de fuente de línea específicas. Debido a que una característica de fuente de línea no específica no implica que la ubicación física de los segmentos de línea esté en cuestión, sino que la posición a lo largo de esos segmentos es incierta, estas características generalmente abarcan más segmentos que las características de fuente de línea específicas.

                              Las características de la fuente de área específica pueden utilizar un búfer biológico opcional, pero no se permite ningún otro búfer. Las entidades de origen de área específicas dan como resultado apariciones de elementos con extensión de área, definidas como áreas delimitadas.

                              Las funciones de origen de área no específicas no pueden utilizar búferes de ningún tipo. El almacenamiento en búfer de procedimiento no está permitido por el motivo mencionado anteriormente. Debido a la naturaleza general de las características de fuente de área no específicas, se implican amortiguadores de precisión tanto biológica como espacial. Para fines de comparación, se asigna un búfer de precisión espacial a una característica de fuente puntual para representar una característica circular. El tamaño y la forma resultantes de esta característica circular abarcan toda el área sobre la cual la ocurrencia tiene una posible influencia. Asimismo, el tamaño y la forma de la característica de fuente de área no específica se elige de tal manera que incluya toda el área sobre la cual la ocurrencia puede tener una posible influencia. En este caso, sin embargo, la función de origen ya es un área y no se requiere ningún procesamiento adicional.

                              IV) La información tabular que se refiere a las características GIS de la ocurrencia del elemento debe almacenarse en una tabla de atributos de característica interna. Estos datos son distintos de toda otra información tabular almacenada sobre la ocurrencia del elemento, como el nombre científico, rango global, estado de listado federal, etc., en que están vinculados directamente a las características GIS de las ocurrencias del elemento. Otra información de apoyo debe almacenarse en una base de datos separada que pueda vincularse al conjunto de datos espaciales GIS.

                              Las columnas contenidas en la tabla de atributos de características de SIG cumplían dos funciones. En primer lugar, se pueden utilizar como "clave principal" para proporcionar un enlace directo a otras tablas de datos. En segundo lugar, pueden proporcionar información específica sobre las propiedades de los SIG. Examine la siguiente estructura de la tabla de la base de datos de diversidad natural de California:

                              En este ejemplo, los elementos MAPNDX, EONDX y ELCODE son claves primarias, lo que permite la conexión a tablas externas. ACC_CLASS y SOURCETYPE contienen valores que se refieren a las propiedades GIS de las características. La inclusión de todas estas columnas no es obligatoria, pero se requerirían ACC_CLASS y SOURCETYPE para que el modelo GIS se implemente como se presenta en este documento (consulte los metadatos completos de la base de datos de diversidad natural de California en http://www.dfg.ca. gov / Nddb / meta.html para obtener información sobre los otros elementos enumerados aquí).

                              Debido a que el valor de precisión real asignado a una característica depende del tipo de característica de origen y se aplica de manera diferente en función de él, esta información se almacena mejor en una tabla de búsqueda separada, utilizando el campo ACC_CLASS como un elemento relacionado:

                              • SOURCETYPE es el tipo de entidad de origen como se describe arriba, punto, línea o área.
                              • ACC_TYPE es el tipo de precisión para la característica espacial, ya sea específica o no específica, como se describe anteriormente.
                              • ACC_VALUE es la precisión espacial de la entidad de origen (más o menos) representada como un valor métrico. Actualmente, esto solo se aplica a las entidades de origen puntual. Se podría decir que el valor de precisión para las características de la fuente de línea y área es igual a la precisión del mapa base a partir del cual se originó, pero en este punto, permanece indefinido.
                              • ACC_CLASS representa la precisión espacial de forma relativa en una escala del uno al diez. Integra el tipo de precisión y el valor de precisión.

                              1. Área delimitada específica con un radio de 80 metros
                              2. Área delimitada específica
                              3. Área delimitada no específica
                              4. Característica circular con un radio de 150 metros (1/10 de milla)
                              5. Característica circular con un radio de 300 metros (1/5 de milla)
                              6. Característica circular con un radio de 600 metros (2/5 millas)
                              7. Característica circular con un radio de 1000 metros (3/5 de milla)
                              8. Característica circular con un radio de 1300 metros (4/5 millas)
                              9. Característica circular con un radio de 1600 metros (1 milla)
                              10. Característica circular con un radio de 8000 metros (5 millas)

                              El valor de precisión espacial expresado en metros para cualquier entidad fuente no puede ser mayor (expresado como un número menor) que la precisión publicada del mapa fuente utilizado como base. Al igual que los búferes, la aplicación del valor de precisión espacial varía según la característica de origen.

                              Actualmente, California ha optado por aplicar valores de precisión espacial únicamente a las entidades de fuentes puntuales. Las siguientes definiciones que se aplican a las características de fuente de línea y área enumeradas aquí representan soluciones posibles pero no implementadas.

                              & # 183 Una característica de fuente puntual específica tendría un valor de precisión espacial igual a la unidad mapeable mínima. En California, esto se ha establecido en 80 metros.

                              & # 183 Una característica de fuente puntual no específica tendría un valor de precisión espacial basado en la precisión con la que la característica ha sido mapeada y expresada como una distancia métrica, más o menos. Aunque las distancias utilizadas podrían ser de cualquier incremento, California ha estandarizado lo siguiente: 80, 150, 300, 600, 1000, 1300, 1600 y 8000 metros.

                              & # 183 Una característica de fuente de línea específica tendría un valor de precisión espacial igual a la unidad mapeable mínima.

                              & # 183 Una característica de fuente de línea no específica también tendría un valor de precisión espacial igual a la unidad mapeable mínima. Recuerde que en este caso, no específico no implica que la ubicación física de los segmentos de la corriente esté en cuestión, sino que la posición de la ocurrencia a lo largo de esos segmentos es incierta. Por esta razón, la entidad fuente en sí incluirá todos los segmentos de línea probables, lo que hará que la ocurrencia sea más larga de lo que podría ser una ocurrencia específica. Dicho de otra manera, la variabilidad en las zonas de influencia para entidades de fuente de línea no específicas aumenta solo en una dirección lineal, en contraposición a radialmente en todas las direcciones como en una zona de influencia para una entidad de fuente puntual no específica.

                              & # 183 Una característica de fuente de área específica tendría un valor de precisión espacial igual a la unidad mapeable mínima. Esto es cierto aunque no se haya aplicado ningún búfer porque la entidad representada tiene el mismo valor de precisión que la publicada para el mapa base.

                              & # 183 Una característica de fuente de área no específica tendría un valor de precisión espacial basado en la precisión con la que la característica ha sido mapeada y expresada como una distancia métrica, más o menos. Estas distancias deben ser las mismas que las utilizadas para las características de fuentes puntuales no específicas (ver arriba). Las zonas de influencia reales no están permitidas para entidades de origen de área no específicas porque su naturaleza general implica que están integradas. Esto permite un rango de valores con los que abordar el problema de & quothow no específico es esta característica no específica? & Quot

                              Se produce una representación visual de la ocurrencia de un elemento usando esta fórmula:

                              Realidad
                              Simbolizado cartográficamente como: Punto, línea o área

                              Característica de fuente y opcionalmente modificado o mejorado por: Precisión procedimental, biológica o espacial

                              Buffer
                              =
                              Ocurrencia del elemento

                              La siguiente tabla resume, por característica de origen, qué tipo de búferes se aplican en la representación de EO:


                              Como probablemente sepa, el índice estándar en SQL Server utiliza una estructura de árbol B +, que es una variación del índice de árbol B. B-tree no es más que una estructura de datos que mantiene los datos ordenados para admitir operaciones de búsqueda, acceso secuencial y modificaciones de datos como inserciones y eliminaciones.

                              Un índice de árbol B contiene al menos dos niveles: la raíz y la hoja. La raíz es el nodo más superior y puede tener nodos secundarios. Si no hay nodos secundarios, el árbol se denomina árbol nulo. Si hay nodos secundarios, pueden ser nodos hoja o nodos intermedios. Un nodo de hoja es la parte inferior del árbol. Pueden existir niveles intermedios entre los niveles de raíz y hoja. La diferencia entre un índice de árbol B y un índice de árbol B + es que todos los registros se almacenan solo en el nivel de hoja para el árbol B +, mientras que en un árbol B podemos almacenar tanto las claves como los datos en los nodos intermedios.

                              Los índices espaciales de SQL Server se construyen sobre la estructura de árbol B +, lo que permite que los índices utilicen esa estructura y sus métodos de acceso. Los índices espaciales también utilizan los principios fundamentales de la indexación XML. La indexación XML se introdujo en SQL Server 2005 y admite dos tipos básicos de índices: primario y secundario. El índice XML principal es un árbol B + que esencialmente contiene una fila para cada nodo en la instancia XML.

                              Entonces, ¿cómo implementa SQL Server el índice espacial? Como ya se mencionó, SQL Server comienza con una estructura de árbol B +, que organiza los datos de forma lineal. Debido a esto, los índices deben tener una forma de representar la información espacial bidimensional como datos lineales. Para ello, SQL Server utiliza un proceso denominado Descomposición jerárquica uniforme del espacio.. Cuando se crea el índice, el motor de la base de datos descompone, o refactoriza, el espacio en una colección de ejes alineados a lo largo de una jerarquía de cuadrícula de cuatro niveles. La Figura 1 proporciona una descripción general de cómo se ve este proceso.

                              Figura 1: TLa descomposición jerárquica uniforme del espacio.

                              Los cuatro niveles de la jerarquía de la cuadrícula se conocen como nivel 1, nivel 2, nivel 3 y nivel 4, como se muestra en la Figura 1. El nivel 1 es el nivel superior. Cada nivel a continuación toma una sección del nivel anterior y se divide en otra cuadrícula. El número de celdas en cada nivel es el mismo para cada eje. Por ejemplo, si el eje Y contiene cuatro celdas, el eje X contendrá cuatro celdas, lo que nos da una cuadrícula de 4 & # 2154. La ventaja de utilizar una jerarquía de cuadrícula de cuatro niveles (jerarquía multinivel) es que es más flexible que una cuadrícula simple porque el índice se basa en una cuadrícula en capas, en lugar de una sola capa de celdas. La división multinivel y la configuración de la cuadrícula indexan todo el geoide, proporcionando así la flexibilidad necesaria para los objetos geométricos.

                              SQL Server utiliza una variación del algoritmo de curva de llenado de espacio de Hilbert para numerar las cuadrículas de forma lineal. El enfoque lineal es importante porque los índices implementan una estructura de árbol B +. Los índices utilizan el orden lineal para la localidad espacial en el índice. (Para obtener más información sobre el algoritmo de la curva de llenado de espacio de Hilbert y su implementación, consulte el artículo & # 8220 Consultando datos multidimensionales indexados utilizando la curva de llenado de espacio de Hilbert. & # 8221)

                              SQL Server utiliza el método de descomposición uniforme jerárquica del espacio antes de leer los datos en el índice espacial. La ventaja de utilizar este método es que aborda las limitaciones de los sistemas de descomposición espacial fijos.


                              Actualizar los metadatos espaciales

                              Para cada columna espacial (tipo SDO_GEOMETRY), debe insertar una fila adecuada en la vista USER_SDO_GEOM_METADATA para reflejar la información dimensional del área en la que se encuentran los datos. Debe hacer esto antes de crear índices espaciales (consulte "Creación de índices espaciales") en las columnas espaciales.

                              La vista USER_SDO_GEOM_METADATA tiene la siguiente definición:

                              La columna DIMINFO es una matriz de longitud variable de un tipo de objeto, ordenada por dimensión, y tiene una entrada para cada dimensión. El tipo SDO_DIM_ARRAY se define de la siguiente manera:

                              El tipo SDO_DIM_ELEMENT se define como:

                              La instancia de SDO_DIM_ARRAY es de tamaño n si hay n dimensiones. Es decir, DIMINFO contiene 2 instancias SDO_DIM_ELEMENT para geometrías bidimensionales, 3 instancias para geometrías tridimensionales y 4 instancias para geometrías tetradimensionales. Cada instancia de SDO_DIM_ELEMENT en la matriz debe tener valores válidos (no nulos) para los atributos SDO_LB (límite inferior), SDO_UB (límite superior) y SDO_TOLERANCE (tolerancia).

                              La tolerancia refleja la distancia a la que dos puntos pueden estar separados y seguir considerándose iguales (por ejemplo, para acomodar errores de redondeo) y, por lo tanto, refleja la precisión de los datos espaciales. El valor de tolerancia debe ser un número positivo mayor que cero.

                              El ejemplo 1-3 inserta filas en la vista USER_SDO_GEOM_METADATA, con información dimensional para cada columna espacial. En ambos casos, el rango dimensional es toda la Tierra y el sistema de coordenadas es el sistema WGS84 (longitud / latitud) ampliamente utilizado (referencia espacial>

                              Ejemplo 1-3 Actualización de metadatos espaciales

                              En el Ejemplo 1-3, la dimensión de longitud de -180.0,180.0 y la dimensión de latitud de -90.90 son necesarias para los datos geodésicos que utilizan el sistema de coordenadas WGS84. El valor de tolerancia de 0,5 significa que cualquier punto que esté a menos de medio metro de distancia se considera el mismo punto por cualquier operador o función basada en la ubicación.


                              29.7 Modelo de error espacial (SEM)

                              Un modelo que puede utilizarse para tomar medidas correctivas directas con respecto a la autocorrelación espacial residual es el modelo de error espacial.

                              Este modelo se especifica de la siguiente manera: [y_i = beta_0 + sum_^ k < beta_kx_> + epsilon_i ]

                              Sin embargo, ya no se asume que los residuos ( epsilon ) son independientes, sino que muestran un patrón de mapa, en forma de media móvil: [ epsilon_i = lambda sum_^ n<>^ epsilon_i> + mu_i ]

                              Se supone que un segundo conjunto de residuos ( mu ) son independientes.

                              Es posible mostrar que este modelo ya no es lineal en los coeficientes (pero esto requeriría un poco de álgebra matricial). Por esta razón, los mínimos cuadrados ordinarios ya no son un algoritmo de estimación apropiado, y los modelos de este tipo generalmente se estiman en base a un método llamado máxima verosimilitud (que no cubriremos en detalle aquí, puede leerlo en Anselin 1988).

                              Los modelos de error espacial se implementan en el paquete espacialreg.

                              Como modelo de remediación, puede dar cuenta de un modelo con una forma funcional mal especificada. Sabemos que el proceso subyacente no es lineal, pero especificamos una relación lineal entre las covariables en forma de (z = beta_0 + beta_1u + beta_2v ):

                              El coeficiente ( lambda ) es positivo (indicativo de autocorrelación positiva) y alto, ya que aproximadamente el 50% de la media móvil de los residuos ( epsilon ) en la vecindad de (i ) contribuye al valor de ( epsilon_i ).

                              Puede verificar que los residuos no están correlacionados espacialmente (tenga en cuenta que la alternativa es "menos" debido al signo negativo del coeficiente (I ) de Moran):

                              Ahora considere el caso de una covariable faltante:

                              En este caso, el patrón residual es particularmente fuerte, con más del 90% de la media móvil contribuyendo a los residuos. Por desgracia, en este caso, la acción correctiva no llega a limpiar los residuos, y podemos ver que aún permanecen correlacionados espacialmente:

                              Esto sugeriría la necesidad de una acción alternativa (como la búsqueda de covariables adicionales).

                              Idealmente, un modelo debe estar bien especificado y las acciones correctivas deben emprenderse solo cuando se hayan agotado otras alternativas.

                              Referencias

                              Anselin, Luc. 1988. Econometría espacial: métodos y modelos. Libro. Dordrecht: Kluwer.

                              Bailey, T. C. y A. C. Gatrell. 1995. Análisis interactivo de datos espaciales. Libro. Essex: Addison Wesley Longman.

                              Bivand, R. S., E. J. Pebesma y V. Gómez-Rubio. 2008. Análisis de datos espaciales aplicados con R. Libro. Nueva York: Springer Science + Business Media.

                              Brunsdon, Chris y Lex Comber. 2015. Una introducción a R para análisis espacial y mapeo. Libro. Sabio.

                              Farber, S. y A. Páez. 2007. “Una investigación sistemática de la validación cruzada en la estimación del modelo Gwr: análisis empírico y simulaciones de Monte Carlo”. Artículo de revista. Revista de sistemas geográficos 9 (4): 371–96. C: / Papers / Journal of Geographical Systems / Journal of Geographical Systems (2007) 9 (4) 371-396.pdf.

                              O'Sullivan, David y David Unwin. 2010. Análisis de información geográfica. Libro. 2do. Edición. Hoboken, Nueva Jersey: John Wiley & amp Sons.


                              Como de costumbre, es una buena práctica despejar el espacio de trabajo para asegurarse de que no tenga elementos extraños allí cuando comience a trabajar. El comando en R para borrar el espacio de trabajo es rm (para "eliminar"), seguido de una lista de elementos que se eliminarán.Para despejar el espacio de trabajo de todos objetos, haga lo siguiente:

                              Tenga en cuenta que ls () enumera todos los objetos que se encuentran actualmente en el espacio de trabajo.

                              Cargue las bibliotecas que utilizará en esta actividad:

                              Ahora que su espacio de trabajo está despejado, puede proceder a invocar el conjunto de datos de muestra. Puede hacer esto mediante los datos de función.

                              El marco de datos missing_df incluye (n = 65 ) observaciones (Nota: el texto entre $ caracteres es notación matemática en LaTeX). Estas observaciones están geocodificadas usando un origen falso y coordenadas normalizadas al cuadrado unitario (la extensión de sus valores está entre cero y uno). Las coordenadas son xey.

                              Además, hay tres variables asociadas con las ubicaciones (VAR1, VAR2, VAR3). Las variables son genéricas. Siéntase libre de pensar en ellos como precios de la vivienda, concentraciones en ppb de algún contaminante o cualquier otra variable que ayude a aclarar su comprensión. Finalmente, una variable de factor indica si las variables se midieron para una ubicación: si el estado es "FALSO", faltan los valores de las variables.


                              CREAR ÍNDICE

                              CREAR ÍNDICE [esquema] índice EN [esquema] tabla (columna)

                              INDEXTYPE ES MDSYS.SPATIAL_INDEX

                              [PARAMETERS ('index_params [Physical_storage_params]')]

                              Crea un índice espacial en una columna de tipo SDO_GEOMETRY.

                              Valor Descripción
                              INDEX_PARAMS Determina las características del índice espacial.
                              layer_gtype Comprueba para asegurarse de que todas las geometrías sean de un tipo de geometría específico. El valor debe ser de la columna Tipo de geometría de la Tabla 2-1 en la Sección 2.2.1 (excepto que no se permite UNKNOWN_GEOMETRY). Además, especificar POINT permite optimizar el procesamiento de datos puntuales. El tipo de datos es VARCHAR2.
                              sdo_dml_batch_size Especifica el número de actualizaciones de índice que se procesarán en cada lote de actualizaciones después de una operación de confirmación. El valor predeterminado es 1000. Por ejemplo, si inserta 3500 filas en la tabla espacial y luego realiza una operación de confirmación, las actualizaciones de la tabla de índice espacial se realizan en cuatro lotes de operaciones de inserción (1000, 1000, 1000 y 500) . Consulte las Notas de uso para obtener más información. El tipo de datos es NUMBER. Predeterminado = 1000.
                              sdo_indx_dims Especifica el número de dimensiones que se indexarán. Por ejemplo, un valor de 2 hace que solo se indexen las dos primeras dimensiones. Debe ser menor o igual que el número de dimensiones reales. Para obtener información de uso relacionada con geometrías tridimensionales, consulte la Sección 1.11. El tipo de datos es NUMBER. Predeterminado = 2.
                              sdo_non_leaf_tbl 'sdo_non_leaf_tbl = TRUE' crea una tabla de índice separada (con un nombre en la forma MDNT_. $) para los nodos no hoja del índice, además de crear una tabla de índice (con un nombre en la forma MDRT_. $) para los nodos hoja. 'sdo_non_leaf_tbl = FALSE' crea una sola tabla (con un nombre en la forma MDRT_. $) tanto para los nodos hoja como para los nodos no hoja del índice. Consulte las Notas de uso para obtener más información. El tipo de datos es VARCHAR2. Predeterminado = FALSO
                              sdo_rtr_pctfree Especifica el porcentaje mínimo de ranuras en cada nodo del árbol de índice que debe dejarse vacío cuando se crea el índice. Los espacios que quedan vacíos se pueden llenar más tarde cuando se insertan nuevos datos en la tabla. El valor puede oscilar entre 0 y 50. El tipo de datos es NÚMERO. Predeterminado = 10.
                              PHYSICAL_STORAGE_PARAMS Determina los parámetros de almacenamiento utilizados para crear la tabla de datos de índice espacial. Una tabla de datos de índice espacial es una tabla de Oracle normal con un formato prescrito. No se admiten todos los parámetros de almacenamiento físico que están permitidos en la cláusula STORAGE de una instrucción CREATE TABLE. La siguiente es una lista del subconjunto admitido.
                              espacio de tabla Especifica el espacio de tabla en el que se crea la tabla de datos de índice. Igual que TABLESPACE en la cláusula STORAGE de una sentencia CREATE TABLE.
                              inicial Es lo mismo que INITIAL en la cláusula STORAGE de una instrucción CREATE TABLE.
                              próximo Es lo mismo que NEXT en la cláusula STORAGE de una instrucción CREATE TABLE.
                              minextents Es lo mismo que MINEXTENTS en la cláusula STORAGE de una instrucción CREATE TABLE.
                              maxextents Es lo mismo que MAXEXTENTS en la cláusula STORAGE de una instrucción CREATE TABLE.
                              pctincrease Es lo mismo que PCTINCREASE en la cláusula STORAGE de una instrucción CREATE TABLE.
                              espacio_tabla_trabajo Especifica el espacio de tabla para las tablas temporales que se utilizan para crear el índice. (Se aplica solo a la creación de índices de árbol R espaciales, y no a otros tipos de índices). Especificar un espacio de tabla de trabajo reduce la fragmentación en el espacio de tabla de índice, pero requiere un espacio de almacenamiento dos veces mayor que el tamaño del índice final, sin embargo, después del índice se crea, puede eliminar o reutilizar el espacio de tabla de trabajo.
                              Controla si se utiliza la ejecución en serie (NOPARALLEL) o la ejecución en paralelo (PARALLEL) para la creación del índice y para las consultas posteriores y las operaciones DML que utilizan el índice. Para la ejecución en paralelo, puede especificar un valor entero de grado de paralelismo. Consulte las Notas de uso para obtener más información sobre la creación de índices paralelos. Predeterminado = NOPARALLEL. (Si PARALLEL se especifica sin un valor entero, la base de datos de Oracle calcula el grado óptimo de paralelismo).

                              Se aplican todos los requisitos previos actuales de SQL CREATE INDEX.

                              Debe tener el privilegio EXECUTE sobre el tipo de índice y su tipo de implementación.

                              La vista USER_SDO_GEOM_METADATA debe contener una entrada con las dimensiones y la información de límites de coordenadas para que la columna de la tabla se indexe espacialmente.

                              Para obtener información sobre índices espaciales, consulte la Sección 1.7.

                              Antes de crear un índice espacial, asegúrese de que el tamaño del segmento de reversión y el valor del parámetro SORT_AREA_SIZE sean adecuados, como se describe en la Sección 5.1.

                              Si se usa un índice de árbol R en datos del sistema de referencia lineal (LRS) y si los datos LRS tienen cuatro dimensiones (tres más la dimensión M), se debe usar el parámetro sdo_indx_dims y debe especificar 3 (el número de dimensiones menos uno) , para evitar el valor predeterminado de 2 sdo_indx_dims, que indexaría solo las dimensiones X e Y. Por ejemplo, si las dimensiones son X, Y, Z y M, especifique sdo_indx_dims = 3 para indexar las dimensiones X, Y y Z, pero no la dimensión de medida (M). (El modelo de datos LRS, incluida la dimensión de medida, se explica en la Sección 7.2).

                              Se puede crear un índice espacial particionado en una tabla particionada. Consulte la Sección 5.1.3 para obtener más información sobre los índices espaciales particionados, incluidos los beneficios y las restricciones.

                              Si desea utilizar un índice espacial particionado local, siga el procedimiento de la Sección 5.1.3.1.

                              No se puede crear un índice espacial en una tabla organizada por índices.

                              Puede especificar la palabra clave PARALLEL para hacer que la creación del índice se paralelice. Por ejemplo:

                              Para obtener información sobre el uso de la palabra clave PARALLEL, consulte la descripción de la cláusula_paralela en la sección sobre la instrucción CREATE INDEX en la Referencia del lenguaje SQL de la base de datos Oracle. Además, las siguientes notas se aplican al uso de la palabra clave PARALLEL para crear o reconstruir (usando la instrucción ALTER INDEX REBUILD) índices espaciales:

                              El costo de rendimiento y los beneficios de la ejecución paralela para crear o reconstruir un índice dependen de los recursos y la carga del sistema. Si las CPU o los controladores de disco ya están muy cargados, no debe especificar la palabra clave PARALLEL.

                              Especificar PARALELO para crear o reconstruir un índice en tablas con geometrías simples, como datos de puntos, generalmente resulta en una mejora menor del rendimiento que en tablas con geometrías complejas.

                              Otras opciones disponibles para índices regulares (como ASC y DESC) no son aplicables para índices espaciales.

                              La creación de índices espaciales implica la creación e inserción de datos de índice, para cada fila de la columna de la tabla subyacente que se indexa espacialmente, en una tabla con un formato prescrito. Todas las filas de la tabla subyacente se procesan antes de que se confirme la inserción de datos de índice, y esto requiere un espacio de segmento de reversión adecuado.

                              Si se proporciona un nombre de espacio de tabla en la cláusula de parámetros, el usuario (propietario de la tabla subyacente) debe tener los privilegios adecuados para ese espacio de tabla.

                              Para obtener más información sobre el uso de la palabra clave layer_gtype para restringir los datos de una capa a un tipo de geometría, consulte la Sección 5.1.1.

                              El parámetro sdo_dml_batch_size puede mejorar el rendimiento de la aplicación, porque Spatial puede preasignar recursos del sistema para realizar múltiples actualizaciones de índice de manera más eficiente que las sucesivas actualizaciones de índice único; sin embargo, para obtener el beneficio de rendimiento, no debe realizar operaciones de confirmación después de cada operación de inserción o en intervalos menores que o igual al valor sdo_dml_batch_size. No debe especificar un valor superior a 10000 (diez mil), porque el costo de la memoria adicional y otros recursos necesarios probablemente superará cualquier aumento marginal de rendimiento resultante de dicho valor.

                              Especificar 'sdo_non_leaf_tbl = TRUE' puede ayudar al rendimiento de las consultas con conjuntos de datos grandes si es posible que toda la tabla del árbol R no quepa en el grupo de búfer de KEEP. En este caso, también debe hacer que Oracle almacene en búfer MDNT_. $ tabla en la agrupación de almacenamientos intermedios KEEP, por ejemplo, utilizando ALTER TABLE y especificando STORAGE (BUFFER_POOL KEEP). Para índices particionados, se debe usar el mismo valor sdo_non_leaf_tbl para todas las particiones. Cualquier parámetro de almacenamiento físico, excepto el espacio de tabla, se aplica solo al MDRT_. $ mesa. El MDNT_. $ table usa solo el parámetro de espacio de tabla, si se especifica, y los valores predeterminados para todos los demás parámetros de almacenamiento físico.

                              Si está creando un índice espacial basado en funciones, el número de parámetros no debe exceder 32. Para obtener información sobre el uso de índices espaciales basados ​​en funciones, consulte la Sección 9.2.

                              Para determinar si una instrucción CREATE INDEX para un índice espacial ha fallado, verifique si la columna DOMIDX_OPSTATUS en la vista USER_INDEXES está establecida en FAILED. Esto es diferente del caso de los índices regulares, donde verifica si la columna STATUS en la vista USER_INDEXES está configurada como FAILED.

                              Si la instrucción CREATE INDEX falla debido a una geometría no válida, el ROWID de la geometría fallida se devuelve en un mensaje de error junto con el motivo de la falla.

                              Si la instrucción CREATE INDEX falla por cualquier motivo, entonces la instrucción DROP INDEX debe usarse para limpiar el índice parcialmente construido y los metadatos asociados. Si DROP INDEX no funciona, agregue el parámetro FORCE y vuelva a intentarlo.

                              El siguiente ejemplo crea un índice de árbol R espacial llamado COLA_SPATIAL_IDX.


                              Ver el vídeo: Rumlig figur i Geogebra