Posts Tagged ‘analysis’

Euclidean allocation analysis II


Imagine you need to promote recycling. Imagine you have 1000 inhabitants from a small village and you need to provide proper colored plastic bags for each and every one of the categories you need to disaggregate: organic, plastic and paper.

You need to service them all properly but you can only choose 5 shops (out of the 10 available)  where you will distribute the bags for free.

In green all 1000 inhabitants (houses) and in orange the placement of all ten shops.


In green the final result: the 5 shops chosen out of the 10 potential available due to having checked they are the most optimal (the shortest euclidean distance).


Software used:

ArcGIS 10.3
ET Geowizards 11.3

Hope you guys liked it,


Allocation analysis: Attaching customers to facilities


Allocates a set of demand points (Customers) to user specified number of supply points (Facilities) out of a Facilities point dataset based on the Euclidian distance between the Customers and Facilities.


100 customers anywhere in the World

In other words the function selects N Facilities out of K candidates to service a set of M Customer locations in such a way that each Customer is allocated to a single Facility (based on Euclidean distance) and the total distance between the Customers and selected Facilities is minimized.


Customers attached to 3 pre-defined facilities

In a more simple way: take a bunch of customers and assign them the closest facility (using euclidean distance, the “ordinary” (i.e. straight-line) distance between two points)). In this particular theoretical analysis I have also selected a maximum range of 5000 meters so anything beyond won’t be taken into consideration.

Questions:  Am i giving a proper service with those facilities i have already deployed?. Is there any of them way too far away so we cannot service at all?. Is there any of them over populated and in the end we cannot provide a proper service?. If you happen to come across any other question, please add it to comments so i can modify the post.

Result table:

FID Shape Id FacilityID Facility Type Num_Alloc Max_Dist Total_Dist
0 Point 0 2 2 Selected 4 4852.68 15362.93
1 Point 0 1 1 Selected 11 4110.57 37839.93
2 Point 0 0 0 Selected 18 4991.27 73591.27

This ArcGIS video shows some light over these type of analysis:

This links shows how to create a network dataset


Software used: ArcGIS 10.3; ET Geowizards 11.1

Hope you guys have liked it, if so, share or let me know about it.

Geographer and MSc GIS

Change detection – Detección de cambios en polígonos




Overall growth rate: -0.12% ONLY HAVING INTO ACCOUNT THE DIFFERENCE OF BUILDINGS CAPTURED BETWEEN 2012 AND 2014 (We can do this because we have used the same data capture model in both years)

(De acuerdo al censo catastral, para 2015 la ciudad incorporó 51.531 predios nuevos urbanos. En total, hay 2’402.581 predios en la ciudad, de esos, 266,9 millones de metros cuadrados son de área totalmente edificada. Source:


THE PROCEDURE: Centroids of buildings; Spatial join showing presence-absence, considering a 10m accuracy threshold, meaning if the centroid has not moved more than 10m, its the same building. If the centroid in 2012 is not in 2014, its considered as demolished. If a new centroid appears its considered new building.

DENSITY MAPS+3D buildings
Help to quickly focus on the highlights


Pearson correlation and GIS


Do these two variables have a correlation?. To answer this important question first of all we have to know that only if it’s a linear relationship and there are no outliers we can take advantage of Mr Pearson’s correlation statiscal tool.

If i love chocolate, does this mean i have tendency of being chuby? or on the other hand there’s no relationship at all. Let’s figure it out.

For this particular occasion, input data XY are two DTM heights, my guess is the following: if correlation is too big, i may deduce they’re not independent products and one might been created from the other, in other words, we might have tried to cheat and we are using a different source that the one we have stated… In GIS sometimes things are not exactly as expected and there’s need to be assertive and making a plan for discovering this minor issues.




Let’s start from the beginning, if source 1 is the same as source 2, the correlation would be perfect, is this correct?. The answer is yes. r (Person correlation) would be = 1. So yes, if this was asking about chocolate and fleshiness this would be 100% right but this hardly or never happens in real life (direct and no other explanation or variable interaction… why is always so0o complicated?).



With real data, you would not expect to get values of r of exactly -1, 0, or 1. For example, the data for spousal ages (white couples) has an r of 0.97. Don’t ask me where i got this weird source (well, just in case:


If i fill source 2 with a random number, the correlation would be almost none accordingly (in this case r=0.17)


Now if we see the diagram of the first two sources and we get the Pearson correlation coefficient (r=0.24) which means the correlation is very weak.


But that was only a very small part of the table (only 30 iterations), so if i do the same calculation out of the +13,000 iterations i really need, i get these figures (by the way, theres no need to use such a complicated formula above, you can use this one in EXCEL: =PEARSON(A1:An;B1:Bn))


So the correlation now its moderate, which makes me deduct at least the sources seem different and i’d need more clues to think my customer might have tried to actually cheat me using the same source for both datasets.


r=1, correlation is PERFECT

0.75<r<1, correlation is STRONG

0.5<r<0.75, correlation is MODERATE

0.25<r<0.5, correlation is WEAK

<0.25, almost NO correlation, both variables are hardy related

I hope you guys have found this post interesting,
looking forward to hear where could you use it and/or your feedback,


Alberto Concejal

Remote Sensing, Photogrammetry, Lidar and Landuse IGN Spain



A few more lines for leting you know again that i passed this other course just now in Instituto Geográfico of Spain (IGN).

Remote Sensing, Photogrammetry, Lidar and Landuse, a comprehensive 40h update on relevant information i need tu use on a daily basis. This ‘update’ helps me to better understand what i am working with and this way, being able to properly describe it for my daily analysis,

PISA report SPAIN 2012 by Comunidades Autónomas Trends North-South and West-East


I wanted to take advantage of the latest ‘advanced course on Statistical Analysis’ followed in the spanish IGN and show you how North-South and West-East trends impact on this report.
As you can see, the higher the values, the most likely to be in the North and the East of the country. This doesn’t mean we are not going to find high values in other CCAA, but this is the result of the trend.

What’s a Comunidad Autónoma? (the administrative level used for this report), You can read it here.

Let say for instance we want to focus on Reading Literacy. The highest values trend on being over the Northern and Eastern Comunidades Autonomas: Navarra, but we also find high values over La Rioja, Asturias, Euskadi or Aragón (they’re all in the North).


The blue line shows how figures are increasing if we move to the North, likewise, if we look at the green line, higher values are in the eastern side of the Map.


Also note how the lowest values fall over the Comunidades Autónomas located in the South and the West of Spain (I.e Andalucía and Extremadura).
It’s also important highlighting there are some outliers or regions with low values in the West (Murcia) or in the North but this is all about Trends!!! : -)

Source: WIKIPEDIA ( and own elaboration
Software used: ArcGIS 10.0 /Geostatistical Analyst extension


I hope you guys find it interesting, please dont hesitate to ask if i can explain you any further.
Thank you for your time,


Analyse des emplacements réservés à la livraison sur voirie: NANTES


*Désole pour mon français, si vous voulez on peut parler en anglais ou espagnol.

La première chose qu’il faut faire c’est télécharger le jeu de données au site:
Thématique : Mobilité

Le jeu propose la géo-localisation des emplacements réservés à la livraison sur voirie dans un secteur limité de la ville de Nantes. Ces aires permettent l’enlèvement et la livraison de marchandises par les professionnels et facilitent le transport des marchandises en ville. 

L’idée c’est savoir s’il y a de concentration dans certains quartiers ou par contra on trouve un patron plus dispersé. Je vais commencer a visualiser les données y j’attends aussi la reponse de quelq’un au Forum avec le ‘shape’ des quartiers et pouvoir finir l’analyse.

J’ai utilisé le logiciel ArcGIS 10.0. C’est facile ajouter les couches, dans ce cas ci, les points où on trouve des emplacements réservés à la livraison sur voirie… on ajoute aussi les images aériennes 20 cm (tout telechargé au meme endroit). Mon hypothèse aussi pondére la taille des emplacements réservés à la livraison.livraison_trend02

L’average nearest neighbor analyse va m’aider a savoir si on travail avec des point dispersés ou par contra concentrés spécifiquement dans certain quartiers. Pour l’instant je ne peux faire que en general parce je n’ai pas encore trouvé la couche pour les quartiers… Donc on peut dire qu’on a un scenario de dispersion.

Analyzing patterns/average nearest neighbor

A travers d’un analyse de densité on peut visuellement voir si il y a un endroit avec des concentrations plus élevées.

Spatial analyst/density

A travers de l’auto-corrélation spatiale nous découvrons un niveaux de signifiance que nous fait douter du résultat de concentration précédent. Pour quoi ?. On vais voir après (j’espère).livraison_trend05
Et aussi nous pouvons voir qu’il n’y a pas de tendance Nord-Sud ou Est-Ouest dans le modèle de localisation.livraison_trend01

Alors ?. On continue bientôt.

Projets éoliens en Loire-Atlantique


C’est vraiment magnifique l’ouverture des données publiques… Je vais décrire mon itinéraire pour mieux comprendre:

  1. Télécharger des données (Projets éoliens en Loire-Atlantique)
  2. Telecharger DTM (SRTM v4)
  3. Faire Carte d’ombrage (ArcGIS),
  4. Orientations (ArcGIS) et
  5. Inclinations (ArcGIS) pour mieux comprendre l’emplacement des moulins
  6. Faire Carte de densité (en mesurent la puissance du parc)


Et maintenant la carte de densité en Global Mapper…



Feature Type=Unknown Point Feature
Geometry=Point location: 321341.949 6688237.734 (Lat/Lon: 47° 11′ 11.0775″ N, 2° 00′ 13.7962″ W)
Map Name=projets_eoliens.shp
ETAT_AVANC=Permis de construire accepté

Et après, avec tous les cartes et toutes les données, faire l’interprétation, voici toutes les moulins du vent en Loire Atlantique, on peut apprécier la concentration au Nord/Nord-Est de la région:


Et aussi la rose des vents (

La rose des vents représentative du secteur d’étude est celle fournie par la station de Nantes-Bouguenais.

Les données ont été recueillies sur une période de 29 années (entre le 1er janvier 1971 et le 31 décembre 2000).

La rose des vents ci-après représente la distribution annuelle des vents (tous mois et toutes heures

Les vents sont classés selon trois catégories :
– vents dont la vitesse est comprise entre 5 et 16 km/h (bleu),
– vents dont la vitesse est comprise entre 16 et 29 km/h (vert),
– vents dont la vitesse est supérieure à 29 km/h (orange).

Ces catégories sont ensuite reportées en terme de fréquence pour chacune des 18 directions de la rose des vents située au centre (nord, sud, est, ouest, etc.)

Les vents dominants sont les suivants :

– Les vents de secteur ouest/sud-ouest et sud (directions de 180 à 280°) qui représentent 36,5% des vents, toutes vitesses confondues. Les vents les plus forts de la station (vitesse supérieure à 29 km/h) soufflent majoritairement dans ces secteurs.

– Les vents de secteur nord-est (24,7% des vents) avec une majorité de vents faibles ou moyens (directions de 20 à 80°).



Idéalement il faut exporté raster->vector et faire l’analyses spatiale mais ça va être un outre post !

Ici, quelques liens et information général:

L’energie eolique.


Éolien terrestre ou off-shore, ce mode de production électrique devrait connaître une accélération sans précédent en Loire-Atlantique d’ici à 2020.

L’éolien apparaît comme la principale source d’énergie renouvelable électrique permettant d’atteindre dans les toutes prochaines années un niveau important de production.

C’est pourquoi Le Département a fixé en juin 2010 un objectif ambitieux de puissance éolienne installée à l’horizon 2020 :

  • 600 mégawatts (MW) terrestres
  • 500 MW en mer.

Vulnérabilité de la population – Analyse SIG



An ancien analyse accompli il y a long temps mais toujours d’actualité. En espagnol.