Analyse du modèle spatial

L'enrichissement des données est important. Collaboration entre entreprises et éducation

Qu'attend-on de voir lors de la visualisation des données de localisation en les ajoutant pour la première fois à la carte? Je suis presque sûr que notre objectif est de déterminer s’il existe des schémas spatiaux: régions caractérisées par une intensité de caractéristiques plus ou moins importante, grappes et points aberrants, directions communes, trajectoires irrégulières, territoires avec des valeurs plus élevées ou plus basses, etc. explorer des modèles que nous sommes prêts à déterminer l’importance des caractéristiques, à construire des modèles prédictifs et à nous appeler nous-mêmes des spécialistes des données.

Les approches utilisées pour découvrir des modèles méritent un article séparé. Actuellement, je suis en train de travailler dessus et je vais commencer par le titre «Arrêtez d'utiliser des cartes thermiques…». Imaginons donc que le chercheur soit au courant des algorithmes d’analyse de modèles et qu’il soit prêt à plonger dans le monde des SIG.

Dans cet article, je mentionnerai l’analyse de modèles de points, montrera les résultats des algorithmes d’analyse de modèles et les problèmes auxquels les professionnels non SIG seraient confrontés, et décrirai la collaboration entre les entreprises et la science pour développer la solution à l’incompétence logicielle actuelle.

Analyse de modèle de points. Intensité Clusters & Outliers

Commençons par un cas simple mais réel: un chercheur a enregistré des sites de vols (accidents de voiture, appels d'urgence, tweets, photos, nids d'oiseaux ou pavillons de castors. Absolument tout type de données de localisation) dans une ville (parc , mer, pays… peu importe quoi). La tâche du chercheur consiste à déterminer s’il existe des modèles spatiaux et à les distinguer s’ils le sont. Il ou elle a construit la grille sur l'aire de distribution en utilisant la taille de cellule spécifique pour éviter les aléas. À l'étape suivante, le chercheur a compté le nombre de caractéristiques dans chaque cellule et a finalement lancé l'analyse des grappes et des valeurs aberrantes et / ou des points chauds et des points froids, selon la tâche à accomplir.

En outre, il ou elle a exécuté l'analyse NNA et l'analyse Quadrat. Le chercheur est donc à peu près sûr que les objets ont maintenant une distribution en cluster et que les résultats montrent ces groupes, ainsi que les valeurs aberrantes.

Analyse de modèle de vols. Capture d'écran de Aspectum

Je dirais que le chercheur est assez satisfait du résultat. Il est assez bon de commencer à explorer les valeurs aberrantes, cependant, la zone couverte par des groupes de valeurs élevées et basses est incroyablement énorme. Pour les personnes qui connaissent la ville, les grappes à valeur élevée semblent évidentes: il s'agit de zones résidentielles et commerciales. Le groupe avec des valeurs faibles (partie bleue) correspond aux forêts, aux rivières et aux zones industrielles.

À ce stade, pour obtenir des résultats plus précis pour les zones en grappes, le chercheur décide de prendre en compte les classes urbaines lors de l'analyse des données. Il peut être utile de rechercher des groupes dans des territoires similaires: comparer la distribution des caractéristiques dans les zones résidentielles séparément des zones vertes ou des zones aquatiques.

Imaginons donc que le chercheur n’ait pas utilisé Aspectum et ait fait face à tous les problèmes liés aux SIG: fichiers de formes, projections, logiciels de bureau encombrants, zones de données de vecteur de distribution, formule de la taille de la grille, algorithmes appropriés via des plugins ou des extensions séparées (en fait, en utilisant Aspectum, il s’agit uniquement des données brutes).

Il doit maintenant créer le jeu de données vectorielles de classification des terres urbaines. Mais comment? Où trouver des données? Quelles zones doivent être distinguées? Quels sont les paramètres pour classer cette zone? Comment automatiser cela pour d'autres tâches?

Le projet. Quand les affaires et l'éducation s'enrichissent

Nous pensons que les sociétés de développement logiciel ont pour tâche de fournir un produit capable de produire un résultat précieux sans qu'il soit nécessaire d'enseigner au public cible à travailler. Et dans le cas d’un SIG, il faut généralement 6 ans d’études secondaires.

Aspectum a décidé de lancer un projet visant à générer des données sur l’utilisation des sols en zone urbaine pour toutes les zones habitées dans le monde. Un objectif aussi ambitieux est devenu intéressant pour nos amis et partenaires de la Rivne Noosphere Engineering School. L’équipe d’étudiants en génie logiciel, SIG, études d’urbanisme et, avant tout, de passion était organisée sous la supervision de conférenciers.

Comme il n'y a pas d'approche correcte pour la tâche, nous avons commencé à développer par itérations, en examinant et en discutant constamment les résultats. Cet article présentera l'idée de base de la mise en œuvre du projet et montrera les résultats maintenant disponibles pour les tests.

Dans les articles suivants, nous allons partager les approches qui ont été testées, les résultats qui ne fonctionnaient pas, les idées d’amélioration et les fonctionnalités supplémentaires mises en œuvre.

Le concept

Il existe d’énormes projets open source traitant de données géospatiales. Notre objectif est de fusionner les données et les moyens de les traiter pour obtenir les informations les plus précises et les plus complètes sur certaines zones des zones de peuplement du monde entier. Juste pour clarifier les choses, il ne s’agit pas de types d’utilisation du sol, mais de la similitude de l’influence sur les phénomènes et les processus se déroulant dans ces zones. Donc, de même que les zones résidentielles peuvent être absolument différentes à travers la ville, nous devons leur assigner différentes classes. D'autre part, nous ne traitons pas de l'approche de zonage - il n'est pas nécessaire de combiner les secteurs de la vente au détail et des affaires au sein d'un groupe. sur les modèles spatiaux dans ces zones.

Résultats actuels

Nous testons actuellement la version MVP du produit, fournissant des informations sur les 4 classes dans une zone de distribution de données. Allez dans Aspectum, ajoutez vos données et lancez l'analyse de la classification des terres urbaines. Le traitement peut prendre un certain temps et nous avons toujours un certain nombre de limitations, mais nous améliorons constamment l’algorithme.

Consultez la carte avec les classes aux niveaux local et régional

Cours aux niveaux local et régional. Capture d'écran de Aspectum

Un certain nombre de développements ont été réalisés au cours de cette tâche et nous sommes heureux de les partager. Jetez un coup d’œil à notre page GitHub, nous mettons à jour et ajoutons constamment des projets là-bas. osm2geojson, notre dernière mise à jour, est une solution pure Python pour traiter les données OpenStreetMap. Suivez Aspectum pour ne pas manquer les prochains articles.