Advertisements

Archive for the ‘statistique’ Category

Indicateur Avancé Sanitaire IAS® – SYNDROME GRIPPAL [FR]

2017/01/23

(Cartograma creado para contribuir a la vigilancia de los síndromes gripales aportando informaciones complementarias a las de la Red ‘Centinelas’ [FR])

L’objectif de l’Indicateur Avancé Sanitaire (IAS®) “Syndrome Grippal” est de contribuer à la surveillance des syndromes grippaux en France en apportant des informations complémentaires à celles du réseau Sentinelles. Cet indicateur a été validé par comparaison avec les données du réseau Sentinelles. Au niveau national, La corrélation croisée avec le réseau Sentinelle est forte (0,88). Cette corrélation valide la pertinence de l’IAS®. L’IAS® est calculé chaque jour en employant une méthode de lissage temporel : les informations des sept jours précédents et des 7 jours suivants sont prises en compte pour calculer la valeur d’un jour donné. Ceci fait que l’indice d’un jour J peut légèrement évoluer jusqu’à J+7.

IAS® Syndrome Grippal : le dernier cartogramme quotidien en haute définition

Openhealth_S-Grippal_DernierCartogramme.jpg

Données issues des sorties consommateurs des officines du réseau CELTIPHARM.

Plus d’infos sur nos méthodes: http://ias.openhealth.fr/methode

http://ias.openhealth.fr/

Les données sont mises à jour quotidiennement. Adopter le J+1 !

source: http://www.data.gouv.fr/fr/datasets/indicateur-avance-sanitaire-ias-syndrome-grippal/

Advertisements

Homicidio doloso en Ciudad de México 2013-2015

2016/11/02

Recibí este link por Facebook hace un rato (Gracias Paco!)… https://hoyodecrimen.com/mapa#/19.4052/-99.0987/12 y me dediqué unos minutos a analizar un hecho puntual, el homicidio doloso, en un periodo concreto de tiempo, de 2013 a 2015. Veamos la previsualización de todos los homicidios ocurridos en 2013 en CARTO.

El autor de la página llamada CRIMEN POR TU RUMBO donde están volcados estos datos es Diego Valle. Desde luego el planteamiento es interesante e inquietante. Quién quisiera saber los crímenes que se han cometido por la zona por donde me voy a mover. Yo?. Yo no, desde luego porque no saldría pero en términos de análisis es sin duda muy, muy interesante.

density-map-mexico-20161102-02-05.jpg

Los datos de incidencia delictiva vienen de una solicitud de información a la SSPDF. El mapa de cuadrantes es de Consulta de Cuadrantes. La población está basada en información del censo 2010 por Manzana.

Mi aproximación era mostrar más que un mapa estático con datos puntuales, un mapa dinámico, que permitiera ver una evolución global de cada uno de los acontecimientos estudiados.Esto son todos los datos en bruto, todos los crímenes

all-crimes-mexico-city-20161102.jpg

Todos los crímenes desglosados. De todos ellos se podría intentar sacar un patrón espacial. Dónde se roba más a los negocios? a los transeúntes, a los taxis? dónde son más comúnes las violaciones? Cuál es la evolución en el tiempo? Tiende a ocurrir más al Norte o más al Oeste? Va la cosa a mejor o a peor?.

density-map-mexico-20161102-02-04.jpg

El resultado preliminar es el siguiente:

density-map-mexico-20161102-02-03.jpgdensity-map-mexico-20161102-02-03d.jpg

Claramente la tendencia es a aumentar y a descentralizarse, veamos a través del maravilloso Carto (ex CartoDB).

Software utilizado: ArcGIS 10.3 + Geostatistical analyst
Global Mapper 17.2 +density maps
Free Video Capture 7.8.3

Algún otro enfoque que os resultaría interesante? No tenéis más que proponerlo.

Un saludo cordial,

Alberto CONCEJAL
MSc GIS

Allocation analysis: Attaching customers to facilities

2016/09/20

Allocates a set of demand points (Customers) to user specified number of supply points (Facilities) out of a Facilities point dataset based on the Euclidian distance between the Customers and Facilities.

customers

100 customers anywhere in the World

In other words the function selects N Facilities out of K candidates to service a set of M Customer locations in such a way that each Customer is allocated to a single Facility (based on Euclidean distance) and the total distance between the Customers and selected Facilities is minimized.

asignation

Customers attached to 3 pre-defined facilities

In a more simple way: take a bunch of customers and assign them the closest facility (using euclidean distance, the “ordinary” (i.e. straight-line) distance between two points)). In this particular theoretical analysis I have also selected a maximum range of 5000 meters so anything beyond won’t be taken into consideration.

Questions:  Am i giving a proper service with those facilities i have already deployed?. Is there any of them way too far away so we cannot service at all?. Is there any of them over populated and in the end we cannot provide a proper service?. If you happen to come across any other question, please add it to comments so i can modify the post.

Result table:

FID Shape Id FacilityID Facility Type Num_Alloc Max_Dist Total_Dist
0 Point 0 2 2 Selected 4 4852.68 15362.93
1 Point 0 1 1 Selected 11 4110.57 37839.93
2 Point 0 0 0 Selected 18 4991.27 73591.27

This ArcGIS video shows some light over these type of analysis:

This links shows how to create a network dataset
http://desktop.arcgis.com/en/arcmap/latest/extensions/network-analyst/exercise-1-creating-a-network-dataset.htm

 

Software used: ArcGIS 10.3; ET Geowizards 11.1

Hope you guys have liked it, if so, share or let me know about it.

Alberto CONCEJAL
Geographer and MSc GIS

Running en Nantes

2016/09/13

Cada vez que corría por esta maravillosa ciudad, lo grababa con la aplicación Runkeeper, así que he superpuesto todas las ocasiones para ver dónde exactamente se concentran las rutas que más he usado y las zonas por las que he pasado más veces. Esto es lo mal de concentrar en la misma persona alguien al que le gusta correr, apuntar cosas, visualizarlas, analizarlas…

Creo que hacer tracking de rutas, tiempos, ritmos, etc, me ayuda a enfocar lo importante que es para mí la regularidad y la constancia. No es correr en sí lo que me gusta, que sí, sino demostrarme que soy capaz de hacer algo que me entretiene, me relaja, de forma periódica y con contadísimas excepciones (lo único que me deja en casa es una lesión o un cabreo).

running-nantes

Y se ve claramente en rojo cuáles son esas zonas!!! He exportado las líneas a puntos y he creado un mapa de densidad en Global Mapper 17, al que he superpuesto un layer de Open Street Maps.

running-nantes-02

Cómo echo de menos correr por el Loira, sus parques, sus puentes, sus riachuelos… ahora corro en Madrid y también me gusta mucho pero me trae muy buenos recuerdos puesto que fue allí donde empecé a hacerlo en serio.

running

Bueno en serio quiero decir, a hacerlo siempre.

Descargas del CNIG. Open Source bien hecho!

2016/02/08

Hola amigos del GIS,
Por motivos de trabajo que no vienen al caso, he tenido que bucear de manera sistemática la web de descargas del CNIG. http://centrodedescargas.cnig.es/CentroDescargas/inicio.do
Una maravilla.

cnig-20160208-01

Por motivos que tampoco viene al caso, he de hacer esto mismo de vez en cuando en todos los Institutos cartográficos del mundo y el del CNIG es sin duda en el que me resulta más fácil, en el que el modelo de datos en más lógico y en el que los links son más fiables de todo el mundo. La única obligación es la atribución obligatoria de los datos. ¿No es mucho pedir, no? Desde el día 27 de diciembre, los datos del IGN son libres CC By 4.0.
https://creativecommons.org/licenses/by/4.0/

Por tanto es obligatorio que mencione la procedencia a pie de imagen, créditos, etc.., sobre todo en publicaciones, usos comerciales, artículos, etc… (Por ejemplo puede poner “<tal dato> CC by instituto Geográfico Nacional” o más bien “derivado de <tal dato” CC by ign.es” o similares…).

cnig-20160208-02

Ya sea porque necesitemos las imágenes del PNOA (Plan Nacional de Ortofotografía Aérea), un modelo digital del terreno de alta resolución o imágenes históricas de nuestro pueblo… tan solo hay que bucear un poco en el catálogo de geodatos del Instituto Geográfico Nacional (Centro Nacional de Información Geográfica) y los conseguiremos.

Por ejemplo, la semana pasada tuve que encontrar datos sobre algunas ciudades españolas para hacer varios escenarios 3D para un cliente y aquí encontré por un lado un DSM 5m elaborado con fuentes LIDAR, por otro lado me bajé de Cartociudad los datos relativos a vectores lineales, manzanas y luego desde la web de CATASTRO (https://www.sedecatastro.gob.es/OVCFrames.aspx?TIPO=TIT&a=masiv) me bajé las geometrías de todos los edificios de la ciudad (que planeo geoprocesar para eliminar las formas no deseadas y para adjudicar alturas precisas gracias al LIDAR bajado con anterioridad).

Por qué no añadir geometrías de Open Street Maps (https://www.openstreetmap.org/export) o de la propia Base Topográfica Nacional BTN25 para completar dicho escenario?

barcelona-bldg-osm-capture-20160112
MADRID-GISDATA

La verdad amigos es que desde que empezó a funcionar el Open Data, los Geógrafos y derivados tenemos mucho con lo que ‘jugar’ para hacer nuestros análisis.
http://idee.es/

Espero que os resulte interesante.

Un saludo cordial,

Alberto
Geógrafo/ Máster SIG UAH/ Diseñador Multimedia

Change detection – Detección de cambios en polígonos

2015/10/22

change-detection-bogota-telemediciones-20151023-02
THE IDEA: DEMONSTRATING HOW DYNAMIC A CITY IS, THUS HOW IMPORTANT IS HAVING AN UPDATED DATASET
bogota-change-detection-20151105-02

THE FACTS: THE CITY OF BOGOTÁ IN COLOMBIA 2012-2014

Overall growth rate: -0.12% ONLY HAVING INTO ACCOUNT THE DIFFERENCE OF BUILDINGS CAPTURED BETWEEN 2012 AND 2014 (We can do this because we have used the same data capture model in both years)

(De acuerdo al censo catastral, para 2015 la ciudad incorporó 51.531 predios nuevos urbanos. En total, hay 2’402.581 predios en la ciudad, de esos, 266,9 millones de metros cuadrados son de área totalmente edificada. Source: http://www.eltiempo.com/bogota/crecimiento-bogota-/15394797)

bogota-change-detection-20151105

THE PROCEDURE: Centroids of buildings; Spatial join showing presence-absence, considering a 10m accuracy threshold, meaning if the centroid has not moved more than 10m, its the same building. If the centroid in 2012 is not in 2014, its considered as demolished. If a new centroid appears its considered new building.

DENSITY MAPS+3D buildings
Help to quickly focus on the highlights
bogota-change-detection-news-20151021

 

Pearson correlation and GIS

2014/11/28


pearson-01
Do these two variables have a correlation?. To answer this important question first of all we have to know that only if it’s a linear relationship and there are no outliers we can take advantage of Mr Pearson’s correlation statiscal tool.

If i love chocolate, does this mean i have tendency of being chuby? or on the other hand there’s no relationship at all. Let’s figure it out.

For this particular occasion, input data XY are two DTM heights, my guess is the following: if correlation is too big, i may deduce they’re not independent products and one might been created from the other, in other words, we might have tried to cheat and we are using a different source that the one we have stated… In GIS sometimes things are not exactly as expected and there’s need to be assertive and making a plan for discovering this minor issues.

 

 

 

Let’s start from the beginning, if source 1 is the same as source 2, the correlation would be perfect, is this correct?. The answer is yes. r (Person correlation) would be = 1. So yes, if this was asking about chocolate and fleshiness this would be 100% right but this hardly or never happens in real life (direct and no other explanation or variable interaction… why is always so0o complicated?).

pearson-formula

pearson-04

With real data, you would not expect to get values of r of exactly -1, 0, or 1. For example, the data for spousal ages (white couples) has an r of 0.97. Don’t ask me where i got this weird source (well, just in case: http://onlinestatbook.com/2/describing_bivariate_data/intro.html)

age_scatterplot

If i fill source 2 with a random number, the correlation would be almost none accordingly (in this case r=0.17)

pearson-06

Now if we see the diagram of the first two sources and we get the Pearson correlation coefficient (r=0.24) which means the correlation is very weak.

pearson-03

But that was only a very small part of the table (only 30 iterations), so if i do the same calculation out of the +13,000 iterations i really need, i get these figures (by the way, theres no need to use such a complicated formula above, you can use this one in EXCEL: =PEARSON(A1:An;B1:Bn))

pearson-07

So the correlation now its moderate, which makes me deduct at least the sources seem different and i’d need more clues to think my customer might have tried to actually cheat me using the same source for both datasets.

Summarizing:

r=1, correlation is PERFECT

0.75<r<1, correlation is STRONG

0.5<r<0.75, correlation is MODERATE

0.25<r<0.5, correlation is WEAK

<0.25, almost NO correlation, both variables are hardy related

I hope you guys have found this post interesting,
looking forward to hear where could you use it and/or your feedback,

Regards,

Alberto Concejal
MSc GIS