Más

Mostrar gráficos de barras en ArcMap

Mostrar gráficos de barras en ArcMap


Estoy tratando de simbolizar datos como gráficos de barras en ArcMap. Tengo una clase de entidad con dos conjuntos de datos y quiero los gráficos de barras uno al lado del otro en el mapa. El problema que tengo es que el mapa solo mostrará las barras si ambos conjuntos de datos no son nulos. ¿Hay alguna forma de mostrar todas las barras con datos? Si pongo 0 para los nulos, aparece una barra plana y tampoco quiero eso.


Existe una opción para excluir ciertos datos en la propia capa. Puede hacer esto y luego graficará todo lo demás.

Seleccione capa-> Opciones-> Simbología-> Gráficos-> Exclusión-> Consulta SQL "Campo" ES NULO

Esto hará que todos los valores nulos no aparezcan en el gráfico de barras. avísame si esto lo resolvió


  • PROFILE_COMPARISON_CHART compara un perfil de destino con un perfil base.
  • MULTI_PROFILE_CHART compara hasta cuatro perfiles de destino con un solo perfil base. El primer perfil de destino de la lista de perfiles de segmentación se utilizará para crear el gráfico de barras. Los otros tres perfiles de destino se crearán utilizando gráficos de líneas en la parte superior del gráfico de barras.
  • GAME_PLAN divide los segmentos en cuatro cuadrantes según la composición porcentual y el índice. Utilice este cuadro para identificar grupos objetivo centrales, de desarrollo y de nicho.

El perfil de segmentación base se puede generar mediante la herramienta Crear perfil por suma de áreas.

Si no tiene claro qué utilizar como perfil de segmentación base, puede utilizar todo Estados Unidos.

La base de segmentación se puede generar utilizando la población adulta total o el total de hogares.

La población adulta total incluye personas de 18 años o más.

El gráfico X se utiliza para controlar la posición del eje x a lo largo del eje y en el gráfico. Un valor de .5 colocará el eje x directamente en el medio del gráfico a lo largo del eje y. Cuando este valor llegue a 0, el eje x se desplazará hacia la izquierda en el gráfico y cuando este valor llegue a 1, se desplazará hacia la derecha en el gráfico. Normalmente, este valor se cambia según el Centro de índice de gráficos. Si el Centro de índice del gráfico se establece muy bajo o espera valores de índice altos en su gráfico, se recomienda establecer este valor en .25, ya que esto proporcionará más espacio en el gráfico para mostrar los valores del índice. Si el Centro de índice del gráfico está configurado muy alto o espera valores de índice bajos en su gráfico, se recomienda establecer este valor en .75, ya que esto proporcionará más espacio en el gráfico para mostrar los valores del índice.

El Centro de índice de gráfico y el Centro de composición de porcentaje de gráfico solo se pueden usar cuando el Tipo de gráfico se establece en GAME_PLAN, pero estos valores siguen siendo opcionales.


Sintaxis

Selecciona el tipo de gráfico de segmentación.

  • GAME_PLAN: divide los segmentos en cuatro cuadrantes según la composición porcentual y el índice. Utilice este cuadro para identificar grupos objetivo centrales, de desarrollo y de nicho.
  • MULTI_PROFILE_CHART: es lo mismo que el Cuadro de comparación de perfiles, excepto que puede elegir hasta tres perfiles adicionales para ver. El primer perfil se compara con el perfil base como un gráfico de barras, y los otros tres perfiles se comparan con el perfil base como gráficos de líneas.
  • PROFILE_COMPARISON_CHART: compara un perfil de segmentación con un perfil base y representa gráficamente el informe de perfil de tapiz del cliente.

El perfil base utilizado en el cálculo del índice y el porcentaje de penetración. Este perfil generalmente se basa en la extensión geográfica de sus clientes.

Uno o más perfiles de segmentación utilizados para generar el gráfico de perfiles múltiples. Los perfiles de destino que se compararán con el perfil base. Normalmente, esto se basa en sus clientes y se genera mediante las herramientas de perfil de segmentación.

Selecciona el grupo de segmentación.

  • Modos de vida: segmentos que comparten una experiencia, como nacer en el mismo período de tiempo, o un rasgo, como la opulencia.
  • Urbanización: segmentos que comparten un lugar, desde los cañones urbanos de las ciudades más grandes hasta los caminos rurales de las aldeas o granjas.

Este valor controla la posición del eje x a lo largo del eje y en el gráfico.

Define el eje x del gráfico. Este valor se utiliza para determinar el índice de umbral de su análisis. Cualquier cosa por encima de este eje excedería el umbral del índice.

Define el eje y del gráfico. Este valor se utiliza para determinar el umbral de composición porcentual de su análisis. Cualquier cosa a la derecha de este eje excedería el umbral.


Sobre el Autor

Flora Vale

Flora es ingeniera de producto en el equipo de análisis y geoprocesamiento de Esri. Le apasiona el uso del análisis espacial y la visualización de datos para responder preguntas y resolver problemas. Además de crear software, a Flora le encanta enseñar métodos analíticos a través de ilustraciones conceptuales y cree que cualquiera puede aprender a pensar espacialmente y tomar decisiones basadas en datos. Flora estudió Geografía y SIG en la UMD y actualmente está realizando un doctorado en Sistemas y Tecnología de la Información en CGU.


Gráficos, informes y animaciones

Los gráficos presentan información sobre las características del mapa & # 8212 y la relación entre ellas & # 8212 de una manera visual y fácil de entender. Los gráficos complementan un mapa porque transmiten información que de otro modo tomaría tiempo resumir y comprender, por ejemplo, puede comparar rápidamente características para ver cuáles tienen más o menos de un atributo en particular. Los datos tabulares no espaciales también pueden ser la fuente de información de la que se extraen los gráficos. Por lo tanto, un gráfico es una buena herramienta de exploración para el análisis de datos espaciales y no espaciales y puede ayudar a revelar patrones o tendencias ocultos.

Los gráficos en ArcMap le permiten comparar relaciones entre mapas y datos de forma dinámica. Puede mostrar información de datos vectoriales y ráster en un gráfico utilizando los mismos colores que en el mapa. Cuando selecciona una característica en el mapa o en una tabla, también se selecciona en un gráfico y viceversa.

Cuando crea un gráfico, elige un campo de una tabla o tabla de atributos de capa. También puede mostrar campos adicionales en el gráfico como una serie. Los datos de cada serie pueden provenir del mismo dataset de entrada o de una de las otras capas disponibles para ArcMap. Por ejemplo, las poblaciones de cinco estados en el oeste de EE. UU. En los años 1950 y 2000 se han representado en un gráfico de barras verticales utilizando datos de dos capas diferentes en el mapa.

Los informes presentan los hechos y las cifras detrás de su análisis y son compañeros invaluables para los mapas que crea. Los informes le permiten mostrar de manera efectiva la información de atributos almacenada con sus datos geográficos sobre las características del mapa en un formato tabular que usted controla.
ArcMap proporciona dos métodos para crear informes. Para un informe simple, use la herramienta de informes incorporada de ArcMap cuando necesite una herramienta de creación de informes gráficos con todas las funciones, use Crystal Reports. Los informes que crea con Crystal Reports se administran como archivos fuera de ArcMap ArcMap simplemente pasa la información tabular de las capas de su mapa a Crystal Reports.

Al utilizar la herramienta de informes incorporada de ArcMap, puede crear informes que se almacenan directamente con su mapa. Una vez creado, puede colocar un informe en el diseño de su mapa junto a sus datos geográficos o guardarlo como un archivo para agregarlo a otro documento de mapa o usarlo para distribuir. También puede exportarlo a varios formatos de archivo diferentes: PDF, RTF o texto sin formato.

Una animación es una visualización de los cambios en las propiedades de un objeto (como una capa) o un conjunto de objetos (como varias capas). Las animaciones hacen que sus documentos cobren vida al almacenar acciones para que se puedan reproducir como usted elija. Pueden ayudarlo a visualizar cambios en perspectiva, cambios en las propiedades del documento, movimientos geográficos y cambios temporales. Utilice animaciones para comprender patrones en los datos a lo largo del tiempo y para automatizar los procesos que se llevarían a cabo para demostrar puntos que solo se pueden realizar a través de dinámicas visuales. Por ejemplo, puede animar los valores de temperatura a lo largo del tiempo, la presión al aumentar la elevación o el crecimiento de una ciudad. El siguiente gráfico es una instantánea de una animación del cambio de población de EE. UU. A lo largo del tiempo. (Haga clic aquí para ver el video de animación completo).

Se pueden reproducir varias animaciones juntas, por lo que, por ejemplo, puede tener una animación que rastree el ojo de un huracán y muestre los cambios de temperatura al mismo tiempo. También puede animar datos en ArcScene y ArcGlobe.


En cartografía digital, gráfico u objeto claramente identificable en el mapa o diseño de página. Por ejemplo, un elemento de mapa puede ser un título, barra de escala, leyenda u otro elemento circundante del mapa. El área del mapa en sí puede considerarse un elemento del mapa, o un objeto dentro del mapa se puede denominar un elemento del mapa, como una capa de carreteras o un símbolo de escuela.

Cualquiera de los objetos o elementos de apoyo que ayudan al lector a interpretar un mapa. Los elementos típicos del entorno del mapa incluyen el título, la leyenda, la flecha norte, la barra de escala, el borde, la información de origen y otro texto, y los mapas insertados.


En cartografía digital, gráfico u objeto claramente identificable en el mapa o diseño de página. Por ejemplo, un elemento de mapa puede ser un título, barra de escala, leyenda u otro elemento circundante del mapa. El área del mapa en sí puede considerarse un elemento del mapa, o un objeto dentro del mapa se puede denominar un elemento del mapa, como una capa de carreteras o un símbolo de escuela.

Cualquiera de los objetos o elementos de apoyo que ayudan al lector a interpretar un mapa. Los elementos típicos del entorno del mapa incluyen el título, la leyenda, la flecha norte, la barra de escala, el borde, la información de origen y otro texto, y los mapas insertados.


Informes de uso disponibles

Los informes de uso disponibles varían según la categoría que esté viendo.

Contenido

Los informes de contenido ilustran cómo los miembros crean, usan y comparten contenido. Los gráficos, las tablas y el mapa admiten interacciones de desglose que le permiten refinar los detalles del informe. Ajuste el tiempo en la parte superior de la aplicación para cambiar el período de informe de los informes. Puede ver la actividad del contenido durante los últimos 12 meses. El valor predeterminado es dos semanas.

  • Detalles del contenido: muestra la cantidad de elementos de la organización en cinco categorías separadas (mapas, capas, archivos, aplicaciones y herramientas) y resume los recuentos en un gráfico de barras. Seleccione una categoría para ver cuántos tipos diferentes de esa categoría existen y para ver una tabla con detalles adicionales. Haga clic en el nombre de un artículo para ver un gráfico con detalles de uso.
  • Extensión del contenido: muestra la extensión geográfica de todos los elementos que posee la organización durante el período del informe.
  • Resumen de contenido: muestra la cantidad de elementos nuevos o modificados agregados a la organización durante el período del informe. Colaboradores es el número de miembros que crearon o modificaron elementos durante el período del informe.
  • Colaboradores: muestra los principales contribuyentes durante este período de informe y cuántas contribuciones envió cada miembro al portal.
  • Resumen de uso compartido: muestra la distribución de cómo los miembros establecen permisos de uso compartido en elementos durante el período del informe.
  • Etiquetas en elementos: muestra una lista ordenada de las etiquetas utilizadas en todos los elementos devueltos en el informe de actividad actual. El tamaño de la etiqueta se escala en función de la frecuencia de su uso.
  • Contenido más popular: muestra los 10 elementos más vistos en la organización desde el día en que se instaló Portal for ArcGIS.
  • Contenido total: muestra un recuento resumido del número total de elementos de la organización. El número máximo de elementos notificables es 10,000.

Miembros

Los informes de miembros le ayudan a comprender el estado de los miembros de su organización y sus actividades en el sistema. Los gráficos, las tablas y el mapa admiten interacciones de desglose que le permiten refinar los detalles del informe. Ajuste el tiempo en la parte superior de la aplicación para cambiar el período de informe de los informes. Puede ver la actividad de los miembros durante los últimos 12 meses. El valor predeterminado es dos semanas.

  • Miembros por función: muestra la distribución de miembros por función, el número de cuentas asignadas y el número de niveles asignados. A los miembros se les asigna una de las cinco funciones del portal: visores, usuarios, editores, administradores y función personalizada. Para obtener más información, consulte Niveles, roles y privilegios.
  • Resumen de utilización y estadísticas: muestra información de uso diversa, incluidas las contribuciones y las actividades de colaboración del miembro seleccionado durante el período de tiempo seleccionado. También muestra la extensión geográfica de todos los elementos propiedad del miembro seleccionado. Para cambiar el informe de detalles de miembros, seleccione un miembro diferente de la tabla Informe de miembros por función.

Grupos

Los informes de grupo proporcionan una sensación de colaboración activa por parte de los miembros de la organización.


Métodos

EpiVue se diseñó utilizando la arquitectura J2EE convencional de 4 niveles que consta de un nivel de origen de datos que utiliza una base de datos PostgreSQL y archivos estáticos, un nivel empresarial que utiliza Enterprise Java Beans (EJB), un nivel web que utiliza servlets y Java Server Pages (JSP), y un nivel de cliente de navegador genérico.

Los tres conjuntos de datos utilizados en este trabajo se obtuvieron originalmente en diferentes formatos. El conjunto de datos de cáncer del estado de Washington [8] estaba en formato ASCII delimitado por tabuladores, el conjunto de datos de muerte del estado de Washington [9] estaba en formato de archivo de datos Xbase (.dbf) y el conjunto de datos de esperanza de vida [10] estaba en formato de hoja de cálculo de Microsoft Excel ( .xls). Cada uno de estos archivos se analizó utilizando programas Perl [24] con los siguientes paquetes de utilidades de Perl: XBase.pm para archivos .dbf y Spreadsheet.pm para archivos .xsl. Los conjuntos de datos analizados se cargaron en una base de datos relacional PostgreSQL [2] utilizando el módulo Perl DBI.pm. Todos los módulos de Perl mencionados anteriormente están disponibles gratuitamente para su descarga desde CPAN [32]. Los datos geográficos de los límites estatales, del condado y de los códigos postales se descargaron del Censo de los EE. UU. 2000 por la Oficina del Censo de los EE. UU. [11]. Los datos geográficos del código postal se cargaron en la base de datos de PostgreSQL [2] y cada código postal está representado por su latitud y longitud centroide. Los datos de los límites del condado y del estado se almacenaron tanto en la base de datos PostgreSQL como en archivos ASCII estáticos delimitados por tabulaciones.

El nivel web y el nivel empresarial son componentes del servidor de aplicaciones JBoss J2EE [3]. Los beans EJB del nivel empresarial interactúan con la base de datos y realizan todas las consultas empresariales. Los servlets en el nivel web procesan las solicitudes del cliente y luego las pasan a los beans EJB y obtienen los resultados de la consulta de los beans EJB. Los servlets también integran varias herramientas de utilidad enumeradas en la Figura 1 para generar respuestas a las solicitudes de los clientes. Las páginas del servidor Java (JSP) en el nivel web se utilizan para presentar respuestas dinámicas a los clientes.

El nivel de cliente se compone de páginas html estáticas y dinámicas que incluyen formularios, tablas, gráficos y JavaScript incrustados con capacidad AJAX para Google Maps ™. AJAX es un grupo de técnicas de desarrollo web interrelacionadas que se utilizan para crear aplicaciones web interactivas. Es asincrónico, ya que los datos adicionales se solicitan del servidor y se cargan en segundo plano sin interferir con la visualización y el comportamiento de una página existente. La mayoría de los navegadores modernos, como Internet Explorer, Firefox y Safari, funcionarán correctamente sin complementos adicionales. Los mapas de polígonos a nivel de estado y condado se implementan utilizando el soporte de Google Maps ™ para KML [25] o KMZ. Los mapas para códigos postales o datos de latitud / longitud se implementan utilizando la programación AJAX con la API de Google Maps ™.

Se puede acceder a EpiVue a través de su sitio web [33].


Principios del mapeo

Los mapas son elementos básicos del periodismo: la necesidad básica de mostrar el "dónde" de las historias significa que se utilizan con frecuencia. A diferencia de algunos tipos de gráficos, como los gráficos de burbujas o los diagramas de red, que pueden requerir alguna explicación para los no iniciados, los mapas no necesitan presentación; todos estamos familiarizados con su uso para navegar. De hecho, gracias a la revolución de los teléfonos inteligentes, la mayoría de nosotros ahora llevamos sofisticadas aplicaciones de mapas interactivos dondequiera que vayamos.

Los mapas también se pueden usar para visualizar datos, que serán nuestro enfoque principal en las próximas clases a medida que procesamos geodatos y aprendemos a mostrarlos en mapas estáticos y en línea. Antes de entrar en los detalles prácticos de la elaboración de mapas, cubriremos algunos principios básicos de la cartografía y las buenas prácticas en la elaboración de mapas.

Los datos que usaremos hoy

Descargue los datos de esta sesión desde aquí, descomprima la carpeta y colóquela en su escritorio. Contiene los siguientes archivos:

  • sf_test_addresses.tsv Archivo de texto con lista de 100 direcciones en San Francisco, para ejercicio de geocodificación.
  • refine_geocoder.json archivo JSON para geocodificar usando Open Refine.
  • sf_test_addresses_short.tsv Las primeras 10 direcciones del archivo anterior.

Los dos primeros archivos también se pueden descargar desde este repositorio de Github.

Para el ejercicio de codificación geográfica de hoy, necesitará una clave de API de Bing Maps y una clave de API de MapQuest. Obtenga su clave Mapquest desde aquí. Si aún no tiene una cuenta de Microsoft, primero deberá crear una antes de solicitar una clave de Bing Maps. Luego, inicie sesión en Bing Maps Portal y seleccione Mi cuenta & gtCreate o ver claves en el menú superior.

Latitud y longitud

Considere los siguientes conceptos en relación con esta imagen:

Al trazar puntos en un mapa, normalmente necesitará conocer su latitud y longitud. La latitud y la longitud es un sistema de coordenadas geográficas que permite que cada ubicación en la superficie de la Tierra se defina con dos números. Las latitudes son distancias angulares, expresadas en grados de 0 a 90, que definen la distancia al norte o al sur de un punto del ecuador. Las longitudes son distancias angulares, expresadas en grados de 0 a 180, que definen la distancia al este o al oeste de un punto de una línea que va del polo norte al polo sur a través del Observatorio Real de Greenwich, Londres. Las líneas de igual latitud se conocen como paralelas, mientras que las líneas de igual longitud se denominan meridianos.

Los grados de latitud o longitud se pueden subdividir en minutos y segundos (a veces llamado sistema DMS), o se pueden dar como decimales. Hay 60 minutos en un grado y 60 segundos en un minuto, los símbolos de grados, minutos y segundos son: °, 'y ". En formato decimal, los puntos al norte del ecuador se dan como valores positivos, mientras que los del sur del El ecuador son negativos De manera similar, para la longitud, los puntos al este del primer meridiano que atraviesa Greenwich son positivos, mientras que los del oeste son negativos.

Para entender cómo funciona esto, considere la ubicación de la Escuela de Periodismo para Graduados de UC Berkeley. Sus coordenadas de latitud y longitud son 37.8749998 y -122.2596684, que también se pueden escribir como 37 ° 52 '30.0 "N, 122 ° 15' 34.8" W. Si dibujaras una línea desde el centro de la Tierra hasta la Escuela-J y luego dibujaras otra hacia el Ecuador con la misma longitud, el ángulo entre ellos sería de 37,8749998 grados. Si tomara una porción de la Tierra en esta latitud, paralela al ecuador, y dibujara dos líneas desde el centro de esta porción, una al primer meridiano y la otra a la escuela J, el ángulo entre ellas sería -122,2596684 grados.

(Varios servicios en línea admiten la conversión de DMS a latitudes y longitudes digitales, y viceversa; los dos enlaces proporcionados son de uso gratuito y deben procesar muchos miles de registros a la vez).

Hay 360 grados en un círculo completo, lo que explica por qué la longitud va de 0 a 180 grados tanto en el este como en el oeste. De manera similar, moverse del Polo Norte al Polo Sur significa viajar a la mitad de la circunferencia de la Tierra, por lo que la latitud va de 0 a 90 grados tanto en el Norte como en el Sur.

Dos puntos separados por un grado de latitud, que se encuentran en la misma longitud, siempre estarán separados por aproximadamente 69 millas, porque los meridianos son siempre del mismo tamaño, lo que representa la mitad de la circunferencia de la Tierra. Sin embargo, los paralelos disminuyen de tamaño a medida que nos acercamos a los polos. En el Ecuador, un grado de longitud nuevamente corresponde a una distancia lineal a través de la superficie de la Tierra de aproximadamente 69 millas. Pero a 45 grados de latitud norte o sur, necesitaría viajar solo 49 millas para cubrir un grado de longitud.

Codificación geográfica

A menudo, al iniciar un proyecto de mapeo, es posible que deba convertir una serie de direcciones en latitudes y longitudes para poder colocarlas en su mapa. Esto se llama codificación geográfica.

Hay varias API de codificación geográfica, a las que se puede acceder de varias formas. La cantidad de solicitudes permitidas por día y los términos de uso varían de un servicio a otro: el servicio gratuito de Google, por ejemplo, permite que cada usuario codifique 2.500 direcciones por día y especifica que las coordenadas resultantes solo se pueden usar para hacer un mapa de Google. .

Debido a esta restricción, utilizaremos los servicios ofrecidos por Bing Maps de Microsoft y MapQuest Open (que se basa en el servicio Nominatim de OpenStreetMap) para geocodificar direcciones de muestra en San Francisco.

Se puede acceder a estas API de codificación geográfica desde Open Refine. A continuación, se explica cómo geocodificar direcciones desde Open Refine utilizando la API de Bing:

Cree un nuevo proyecto Open Refine importando un archivo de texto que contenga direcciones completas en una columna, con la dirección del encabezado. Nuestros datos de prueba ya están en este formato, use sf_test_addresses_short.tsv para este ejercicio inicial.

En la columna de dirección, seleccione Editar columna & gtAgregar columna obteniendo las URL. , llame a la columna bing_json y use la siguiente expresión:

Tenga en cuenta que deberá ingresar su propia clave API de Bing en lugar de BingMapsKey. Además, establezca el retardo del acelerador en 500 milisegundos para un procesamiento más rápido. Esta expresión construye una URL que consultará la API de codificación geográfica de Bing y devolverá los datos de la dirección en cuestión en formato JSON.

En la columna bing_json, seleccione Editar columna & gtAgregar columna según esta columna. , llame a la columna bing_lat_lon y use esta expresión para extraer la latitud y la longitud del JSON devuelto por la API:

Divida la columna bing_lat_lon en dos columnas seleccionando Editar columna & gtSplit en varias columnas, luego cambie el nombre de estas columnas bing_latitude y bing_longitude.

En la columna bing_json, seleccione Editar columna & gtAgregar columna según esta columna. , llame a la columna bing_confidence y use esta expresión para extraer la confianza de la API de Bing en la precisión de su codificación geográfica:

En la columna bing_json, seleccione Editar columna & gtAgregar columna según esta columna. , llame a la columna bing_type y use esta expresión para extraer el tipo de lugar que la API de Bing ha codificado geográficamente:

Para una dirección completa, debe devolver la dirección cuando la codificación geográfica se haya realizado correctamente.

Finalmente, elimine la columna bing_json seleccionando Editar columna & gtRemove column.

Como vimos en la semana 4, ahora es posible extraer código JSON que te permitirá repetir estos pasos en cualquier dato en el mismo formato.

El archivo refine_geocoder.json geocodificará una muestra de direcciones utilizando las API abiertas de Bing y MapQuest. Nuevamente, deberá reemplazar BingMapsKey en este archivo con su propia clave de API de Bing y MapQuestKey con su clave de API de MapQuest. En clase, usaremos este código para geocodificar el conjunto de datos sf_test_addresses.tsv más grande.

Para los resultados de MapQuest Open, la columna mapquest_class proporciona información sobre la precisión de la codificación geográfica: el lugar, el equipamiento o la tienda indican la codificación geográfica a una dirección precisa, la autopista indica la codificación geográfica a una calle únicamente. La columna mapquest_type proporciona más información sobre la dirección o calle en cuestión.

Otras opciones de geocodificación incluyen el geocodificador GPS Visualizer. Necesitará claves de API para los servicios de codificación geográfica que utiliza.

El geocodificador de GPS Visualizer funcionará a partir de una lista simple de direcciones, o de datos tabulares, con diferentes aspectos de la dirección (dirección, ciudad, estado, código postal, etc.) en campos separados. Establezca el Tipo de control de datos según corresponda. Si está trabajando con datos tabulares, con la dirección dividida en varios campos, ajuste el Separador de campo en el control de salida para reflejar el separador en sus datos. Recomiendo encarecidamente utilizar la opción de lista sin procesar, 1 dirección por línea, que en mi experiencia da resultados mucho más fiables.

Al marcar Incluir fuente + información de precisión en la salida, se asegurará de que la salida incluya una notificación de la precisión de la codificación geográfica para cada registro: la dirección indica la codificación geográfica precisa para una dirección en particular.

Seleccione Bing Maps como fuente y pegue su clave API de Bing Maps en el cuadro. Luego pegue los datos de la dirección, menos la fila del encabezado, del archivo sf_test_addresses.tsv en el cuadro Entrada :, haga clic en Iniciar geocodificación y los resultados aparecerán en el cuadro Resultados como texto :. Cuando se hayan procesado todas las direcciones, copie y pegue los resultados en un archivo de texto y guárdelo. Si tiene una gran cantidad de direcciones para codificar geográficamente, le recomiendo dividirlas en lotes de 1000 o menos.

Independientemente del servicio que utilice para codificar direcciones geográficamente, proporcione el reconocimiento correspondiente. Los términos y condiciones de MapQuest requieren que incluya este reconocimiento en cualquier sitio web o aplicación que utilice datos codificados geográficamente a través de su servicio:

Los datos también deben obtenerse en OpenStreetMap; consulte aquí las instrucciones sobre cómo acreditar adecuadamente.

Aquí hay un reconocimiento HTML a Bing en el mismo estilo que el anterior:

Tenga en cuenta que diferentes geocodificadores darán resultados ligeramente diferentes. En mi experiencia, MapQuest Open tiende a ubicar direcciones en aceras o fachadas de edificios, mientras que Bing tiende a ubicarse en el medio del edificio en cuestión. La tasa de fallos de Bing también parece ser menor. Es posible que deba registrar manualmente las coordenadas de las direcciones que fallan o que no se codifican geográficamente en una dirección precisa. En estos casos, intente buscar la dirección en Bing Maps o Google Maps. Para este último, tenga en cuenta la latitud y la longitud del marcador de lugar que aparece, que se muestra aquí después del símbolo @:

También es posible que desee experimentar con GeoServices de Texas A & ampM University, que geocodificará desde un archivo de texto cargado y le enviará un correo electrónico cuando los resultados estén listos para descargar. Primero regístrese para obtener una cuenta gratuita y luego cargue sus datos.

Proyecciones cartográficas

Debido a que la Tierra es aproximadamente esférica, cualquier mapa que no sea un globo terráqueo es una distorsión de la realidad. Así como no se puede pelar una naranja y colocar la piel como un rectángulo, círculo o elipse perfecto, es imposible trazar la superficie de la Tierra en dos dimensiones y representar con precisión distancias, áreas, formas y direcciones.

Los mapas se pueden hacer simplemente trazando la latitud en el eje X y la longitud en el eje Y en la misma escala, a veces llamada proyección equirrectangular:

Sin embargo, la mayoría de los mapas se dibujan de acuerdo con un sistema de proyección más sofisticado. Hay muchos sistemas diferentes, cada uno de los cuales tiene ventajas e inconvenientes. Algunas proyecciones están optimizadas para minimizar la distorsión del área, otras tienen como objetivo preservar la forma o la distancia, mientras que otras mantienen las direcciones constantes.

Google y la mayoría de los demás mapas en línea utilizan una proyección de Mercator, que se diseñó originalmente para la navegación en el mar. El principal punto fuerte de la proyección de Mercator es que conserva la dirección, de modo que cualquier línea recta dibujada en el mapa es una línea de rumbo constante de la brújula. Los paralelos son todos horizontales y los meridianos verticales. Esta preservación de la dirección también es una buena opción para los mapas ampliables que se utilizan principalmente para la orientación local. El gran inconveniente de esta proyección es que distorsiona el área y la forma, especialmente en latitudes altas, lo que la convierte en una mala elección para representar al mundo entero. Observe cómo las distancias entre paralelos aumentan con la latitud:

Al mapear el territorio continental de los Estados Unidos, particularmente al colorear o sombrear diferentes áreas de acuerdo con los valores de los datos, es común usar la proyección Cónica de área equitativa de Albers, como se ve en este mapa de condiciones de sequía en todo el país:

Como sugiere el nombre, esta proyección minimiza las distorsiones del área. No conserva el rumbo de la brújula: observe que la frontera con Canadá, que corre a lo largo de un paralelo a una latitud de 45 grados N, es una curva, en lugar de una línea recta.

La proyección cónica de área equitativa de Albers rara vez se usa para mostrar la Tierra completa, por razones obvias cuando se ve la proyección en una vista global:

Para minimizar la distorsión del área en un mapa global, una mejor opción es la proyección de Mollweide:

La proyección de Mollweide también se usa a menudo para mapas de todo el cielo (que se puede considerar como el interior de una esfera). Lo usé aquí para comparar la resolución de mapas de la radiación de fondo de microondas cósmica, que revelan ondas en el espacio-tiempo que son los remanentes de las condiciones en el Universo temprano, con vistas de la Tierra:

La principal desventaja de la proyección de Mollweide es la distorsión de la forma en latitudes y longitudes altas; mire, por ejemplo, Alaska en los mapas de Mollweide anteriores.

En determinadas circunstancias, preservar la distancia puede ser el objetivo más importante. Aquí, una proyección equidistante azimutal es el mejor enfoque:

A continuación, se utiliza una proyección equidistante azimutal, centrada en Corea del Norte, para ilustrar las ubicaciones que podrían encontrarse dentro del alcance de los misiles balísticos de ese país:

Aquí, a modo de comparación, hay un mapa que destaca la zona dentro de los 10,000 km de Corea del Norte utilizando la proyección Mercator de Google Maps:

Como muestran los mapas Equidistante azimutal de Corea del Norte y Cónica de área equitativa de Albers de la sequía de los EE. ver para un mapa global.

Las distorsiones de forma, área, distancia y dirección son más obvias cuando se representa todo el mundo. En estas circunstancias, los cartógrafos a menudo adoptan una proyección de compromiso en la que la distancia, el área, la forma y la dirección están distorsionadas, pero en un grado mínimo. Un ejemplo es la proyección de Robinson:

Esta fue la proyección que usé para los mapas del PIB per cápita global que vimos en la semana 1:

Además de una proyección, un mapa también tiene un dato, que se refiere a un modelo matemático que representa la forma de la Tierra, que no es una esfera perfecta.

Poner datos en mapas

Círculos escalados frente a mapas de coropletas

Los datos se pueden colocar en mapas de varias formas. Cuando las variables continuas se grafican en puntos, un enfoque común es usar círculos centrados en cada punto, dimensionados de acuerdo con los valores de los datos. Aquí hay otro ejemplo de este enfoque, que se utiliza para mostrar las muertes causadas por tornados:

Al trazar datos en áreas geográficas, el enfoque más común es llenar las áreas con color de acuerdo con los valores de los datos, como mis mapas de PIB per cápita o el mapa de sequía de EE. UU. Anterior. Estos se conocen como mapas de coropletas.

Los mapas de coropletas tienen un inconveniente importante: nuestros ojos se ven atraídos por extensiones de color, lo que significa que grandes áreas geográficas atraerán una mayor atención, sean o no más importantes para la historia que está tratando de contar a partir de los datos. Esto se convierte en un problema particular con los mapas que ilustran los resultados de las elecciones, donde se minimiza la importancia de las áreas geográficas pequeñas con grandes poblaciones que tienen un impacto importante en el resultado general, mientras que se enfatiza demasiado la importancia de las áreas grandes escasamente pobladas. Al mirar este mapa de resultados de las elecciones presidenciales de 2012 por condado, por ejemplo, uno pensaría de un vistazo que Mitt Romney fue el ganador:

En tales casos, los círculos escalados ubicados en el centro de áreas geográficas pueden ser una mejor opción. Here is another map from the same interactive, using that approach to visualize the size of each candidate’s lead in each county, measured by the absolute number of votes. This shows how Barack Obama won the election through his strong support in densely populated urban areas:

Cartograms

Another solution to the main drawback of choropleth maps is to distort the areas plotted on the map to reflect aspects of the data, rather than geographical reality. These maps are called cartograms.

There are several algorithms for making cartograms which preserve the boundaries between geographical areas, which result in “organically” distorted maps. Here, for example, is a rendering of the 2012 Presidential Election results by county, distorted using the algorithm described in this scientific paper:

A good tool for making maps like this is Scapetoad. However, bear in mind that the impact of these maps derives from their disconcerting perspective. That can be useful to make your audience think about an issue in a new way, which was the thinking behind these maps of mine, comparing nations measured by GDP, and by a measure called the Happy Planet Index:

The cartograms we have seen so far retain common borders between areas, which constrains the accuracy with which areas can be resized according to values for a continuous variable. By relaxing this constraint, it is possible to resize areas more precisely:

However, bear in mind that it is hard to compare the areas of non-regular shapes, so either form of cartogram is not so useful if you want your audience to be able to “read” the data in a precise way.

It is also possible to make geometric cartograms, which use the area of shapes (generally circles or squares) to make a more abstract “map” in which the relative size of different elements is easier to compare. This graphic from The New York Times, published during the 2012 Presidential election campaign, took this approach:

Along similar lines, for its coverage of the 2010 U.K. General Election, the BBC represented each parliamentary constituency as a hexagon of equal area. The resulting map bore sufficient resemblance to an actual map of the United Kingdom to be meaningful, and users of the website could switch between the proportional and geographical maps to gain a more complete picture of the results by location:

Hexagons have advantages for mapping because they tile perfectly in a honeycomb-like grid. Maps of this type, sometimes called “tilegrams” have since become popular for representing election results and forecasts. Here, for example, is a map representing the electoral college for the 2016 presidential election, from FiveThirtyEight:

The data visualization studio Pitch Interactive recently created a tool for making U.S. tilegrams. To use the resulting map in other mapping tools, click the Export Toposon button. You can then use mapshaper to convert to other geodata types, see below. There is also an R package called tilegramsR, see here and here for examples.

Dot density maps: Seeing the big picture by showing all (or most) of the data

Sometimes patterns emerge from geographic data when we see the spatial distribution of every single occurrence of a phenomenon. This is the thinking behind dot density maps, like this visualization of the 2010 U.S. Census, which includes a colored point for every single person:

The overall effect is rather like pointillist art. These maps work well when zoomed out, but are not so informative at high zoom levels.

A similar approach can work with aggregations of data, as in this project from The New York Times, which drew one dot for every 200 people, rather than one dot per person:

Making sense of many overlapping points: Heatmaps vs. hexagonal binning

While dot density maps can be useful on occasion, sometimes you may need to tell a story based on the distribution of points where they overlap, or sit directly on top of one another. This can present a misleading picture, as much of the data will be obscured.

Under such circumstances, other approaches are necessary. Heat maps, for example, plot the density of points on a map as a gradient of colors, typically running from cool blues or greens to warm reds. Here, to illustrate, I have used this approach to map violent events in Syria’s civil war from its start to the end of the first quarter of 2013, revealing “hotspots” of violence that were not so obvious from a map of thousands of overlapping points, seen below:

(Source: Peter Aldhous, from GDELT data)

While heatmaps are good for qualitatively identifying hotspots, they are less useful for communicating quantitative information. For this purpose, a better approach is to superimpose a hexagonal grid over the map, count the points in each cell, and use those counts to create a choropleth map, based on the grid. I used that approach on the same data to make this map of Syria’s conflict:

Think before you map: Is this the best representation of the data?

Whenever you come across data that can be put on a map, it’s very tempting to do this. However, always ask yourself: Is this the best way of telling my story? From the examples above, you will see that most maps encode data either using color, or through the area of circles or other symbols. You will remember from week 2 that these two visual encodings fall fairly low down on the perceptual heirarchy of visual cues, making it relatively hard for your audience to make accurate, quantititative comparisons.

Consider these two representations of similar data on rates of overall gun death (the map) and gun homicides (the bar chart) by U.S. state:

The bar chart clearly allows the more detailed comparison between rates for different states. However, the map still has value because it does show that the states with the highest gun death rates occur in particular geographic locations. In cases like this, consider using a map as only one part of your graphic, perhaps as a secondary element.

Static vs. zoomable tiled maps

When designing a map-based graphic, one of the first things to decide is whether you want to display a static map view, or whether users should be able to pan and zoom the map in a dynamic way.

Web maps that can be panned and zoomed generally depend on a series of world maps of different zoom levels, which are each divided into square tiles. The tiles are loaded into the web browser as required as the user pans and zooms the map. This image demonstrates the principle:

Zoomable data-driven web maps are often displayed over basemaps from Google, OpenStreetMap, or another provider. Because these basemaps use a Mercator projection, that projection needs to be used for the data layers also.

Geographic data formats

Most commonly you will come across geodata in which values are attached to points, lines or polygons. This is called “vector” geodata, and here are some common formats. (For points, geodata may also be provided in CSV format.)

KML, or Keyhole Markup Language, is the format used to display data on Google Earth and Google Maps. As the name suggests, it is based on XML, and has a similar structure of nested tags.

These tags can define a range of elements including point markers such as the familiar placemarks used on Google Maps, lines, and the boundaries of geographical areas, known as “polygons.” The coordinates of these elements, their color and other aspects of their styling, and the information bubbles that may appear when the elements are clicked, can all be encoded in the KML.

Here, for example, is a simple KML file coding for an exaggeratedly tall representation of The Pentagon. Notice how the coordinates for the polygon give latitudes and longitudes that define the inner and outer boundaries of the building, and locate the “roof” at a height of 100 meters above ground level. <extrude>1</extrude> extends the shape to the ground:

Here is how this file displays in Google Earth:

See Google’s tutorial and reference for a guide to the tags that can be used to code KML.

KML can also be compressed into KMZ files. To create a KMZ file from KML, open the file in Google Earth, right-click on the file in the Places panel, select Save Place As , and then select KMZ under format.

KML has been adopted as a standard for geographic data, and so can be used by a wide range of mapping applications, including Geographic Information Systems (GIS) software.

GeoJSON

GeoJSON is a variant of JSON develeoped for encoding geographic data, commonly used for data-driven online maps. Its overall structure is the same as conventional JSON. Each Feature has properties , which can be any data related to the feature, geometry , which includes its type (point, polygon and so on), and latitude and longitude coordinates . Features can be grouped into a FeatureCollection . Here, for example, are the first ten addresses we geocoded earlier using the Bing maps API, encoded as GeoJSON (you may need to scroll to the right to see all of the data):

TopoJSON is an extension of GeoJSON which is more compact, because polygons are described by line segments, rather than their entire boundaries. This means that the boundary between California and Nevada, for instance, is represented only once, rather than twice — once for each state. This keeps file sizes small, which can be advantageous when data must be loaded and rendered in a web browser.

Shapefile

This is a geodata format developed by ESRI, manufacturer of ArcGIS, the leading commercial Geographic Information System (GIS) application. Shapefiles can represent elements including points, lines and polygons, and can also include information on map projection and datums.

Shapefiles are usually made available for download as zipped folders, and actually consist of a series of files. At a minimum, a shapefile must contain three component files, with the same root name and the following extensions:

  • .shp The main file containing the geometry of the points, lines or polygons mapped in the shapefile.
  • .dbf A database file in dBASE format containing a table of data relating to the components of the geometry. For example, in a world shapefile giving national boundaries, this table might contain data about the countries including their names, capital cities, population, annual GDP, and so on.
  • .shx A positional index of the shapefile’s geometry.

There are several optional file types that may also be included, including a .prj file, which defines the map projection and datum to be used when loading the shapefile into GIS software. Refer to ESRI’s technical specification and the informative Wikipedia entry for more details.

Many government agencies, such as the U.S. Census Bureau, provide data for mapping as shapefiles. You can also download shapefiles from repositories such as Natural Earth.

Converting between vector geodata formats

We will later learn how to use QGIS to convert between the main geodata formats. In addition, this site converts shapefiles to GeoJSON and TopoJSON. Mapshaper, which we will later also use to simplify the geometry of geodata, will import and export data as Shapefile, GeoJSON, and TopoJSON, and so can also be used for data conversion.

Mapping images: raster geodata

Satellite and aerial images can also be placed into maps, which requires the images to be georeferenced, or have location imformation associated with them. Formats for raster geodata include GeoTIFF. If you need to make maps with raster geodata for your final projects, contact me for help!

Assignment

  • Submit an update on your final project, detailing the data you are using, the questions you want to address.
  • Share your data and any visualizations made so far with me.
  • Pay particular attention to explaining any obstacles/problems, so we can brainstorm/solve.
  • From here on, you should arrange meetings to discuss your work as required. Make appointments on the Google Calendar we used previously to arrange meetings during my office hours, on Friday afternoons. I can stay as late as 6pm. If those times are not convenient, email me to arrange a time to talk by Skype.

Further reading

Mark Monmonier: How to Lie With Maps
This popular exploration of how all maps distort reality, and how some can seriously deceive, provides a good overview of cartographic principles.