Der RWI-GEO GRID-Datensatz basiert auf knapp 220 000 1x1 km Rasterzellen in denen Wohn- und Gewerbeimmobilien vorzufinden sind. Für diese Raster werden sozioökonomische Daten zur Verfügung gestellt. Für jede Rasterzelle enthält der Datensatz eine Vielzahl von Variablen zu den Haushalten, der Haushaltsstruktur, der Demografie, dem Ausländeranteil, der Mobilität, der Kaufkraft sowie der Arbeitslosenquote und dem Kreditausfallrisiko. Die Daten sind aktuell für die Jahre 2005 und 2009-2022 erhältlich.
The RWI-GEO GRID dataset is based on almost 220,000 1x1 km grid cells in which residential and commercial properties are located. Socio-economic data is provided for these grids. For each grid cell, the data set contains a large number of variables on households, household structure, demographics, the proportion of foreigners, mobility, purchasing power, unemployment rate and credit default risk. The data is currently available for the years 2005 and 2009-2022.
RWI-GEO-GRID
Aggregation
In die Datenerstellung fließen mehr als eine Milliarde Einzelinformationen ein. Diese Daten liegen anonymisiert vor und werden von mehreren Quellen bezogen. Die einfließenden Daten liegen grundsätzlich für sämtliche 40.9 Mio. Haushalte in Deutschland vor und werden für die rund 20 Mio. Häuser ausgewiesen.
Microm uses more than a billion individual datapoints for the aggregation of the microm dataset. These are anonymised and stem from various data sources. The datatapoints are are available for all 40.9 million households in Germany, while the final data product contains information on approximately 20 million houses.
Aus Gründen des Datenschutzes werden mehrere zu einem Wohnfeld gehörende Häuser zu einer sogenannten Mikozelle zusammengeführt. Diese Mikozellen beinhalten mindestens fünf, durchschnittlich acht Haushalte. Dabei bilden größere Häuser, in denen mehr als fünf Haushalte leben ihr eigenes Segment. Häuser mit weniger als fünf Haushalten werden mit vergleichbaren Häusern in der gleichen Straße zusammengefasst, so dass die Mikrozelle dann mindestens fünf Haushalte umfasst. Die zusammengefassten Häuser weisen eine größtmögliche räumliche Nähe auf. Zudem werden Strukturindikatoren für die jeweilige Mikrozelle verdichtet, und die Information wieder pro Haushalt als Datei aufbereitet. Wann immer dies möglich ist, werden die errechneten Daten mit anderen Datenquellen wie beispielsweise amtlichen Daten, die auf einer höheren Aggregationsstufe vorliegen, abgeglichen.