Grundlage für die Variablengruppe Ethno bildet eine Vor- und Nachnamenanalyse
hinsichtlich ihrer sprachlichen Herkunft und liefert demzufolge die Sprachabstammung von
Personen. Die Auswertung der Namen basiert dabei auf Listen, in denen die sprachliche
Abstammung der Namen verzeichnet ist. Zusätzlich werden diese Listen durch internationale
Namensverzeichnisse ergänzt. Die Namensanalyse bezieht sich jeweils auf den
Haushaltsvorstand. Es können keine Aussagen darüber getroffen werden, wie viele Personen
tatsächlich eine ausländische Herkunft haben, wie lange die Person bereits in Deutschland
lebt, oder wie ihre sozialen Anbindungen in Deutschland sind. Für die Variablengruppe
"Ethno" können auf Grundlage der Analyse folgende Sprachabstammungen gebildet werden:
Türkei, Italien, Griechenland, Spanien/Portugal/Lateinamerika, Spätaussiedler aus der
früheren Sowjetunion, Osteuropa, Balkan, Afrika südlich der Sahra, außereuropäische
islamische Staaten und Süd-, Ost- und Südostasien (microm 2016, S. 40). Die
Variablengruppe "Ethno" wird ursprünglich auf PLZ-8 Ebene ausgewiesen und für den
Datensatz auf das Raster heruntergerechnet (microm 2016, S. 40).
The variable group ethno is based an analysis of fore- and surnames with respect
to their linguistic origin. The evaluation is based on lists of names and their origin,
which are supplemented by international name roll of names. It only considers the head of
the households. Thus, this does not allow for conclusions about the actual number of
persons with a foreign origin, how long the individuals have already been Germany, and how
strong the social integration is. For the variable “ethno” the following linguistic
origins can be formed: Turkey, Italy, Greece, Span/Portugal/Latin America, ethnic German
repatriates (Spätaussiedler) from the former Soviet Union, Eastern Europe, the Balkans,
Africa south of the Sahara, non-European Islamic states, South-, East- and Southeast-Asia
(microm 2016, p. 40). This variable group is originally calculated on the “8-digit post
code” (PLZ8) level and is disaggregated to the raster used by this dataset (mircom 2016,
p. 40).
RWI-GEO-GRID
Other
Aus Gründen des Datenschutzes werden mehrere zu einem Wohnfeld gehörende
Häuser zu einer sogenannten Mikrozelle zusammengeführt. Diese Mikrozellen beinhalten
mindestens fünf, durchschnittlich acht Haushalte. Dabei bilden größere Häuser, in
denen mehr als fünf Haushalte leben ihr eigenes Segment. Häuser mit weniger als fünf
Haushalten werden mit vergleichbaren Häusern in der gleichen Straße zusammengefasst,
so dass die Mikrozelle dann mindestens fünf Haushalte umfasst. Die zusammengefassten
Häuser weisen eine größtmögliche räumliche Nähe auf. Zudem werden Strukturindikatoren
für die jeweilige Mikrozelle verdichtet, und die Information wieder pro Haushalt als
Datei aufbereitet (microm 2016, S. 8). Wann immer dies möglich ist, werden die
errechneten Daten mit anderen Datenquellen wie beispielsweise amtlichen Daten, die auf
einer höheren Aggregationsstufe vorliegen, abgeglichen (microm 2014, S. 2). Zudem
ermöglicht die Zusammenarbeit des SOEP und microm eine inhaltliche Beschreibung sowie
Validierung der kleinräumigen microm Daten (microm 2016, S. 8). Die Basis des
Datensatzes bildet die Variablengruppe microm-Basis. Diese ist in die folgenden vier
Unterklassen unterteilt: Anzahl der Haushalte, Anzahl der Gewerbebetriebe, Anzahl der
Häuser (inklusive reiner Gewerbehäuser) und Anzahl der Wohngebäude (exklusive reiner
Gewerbehäuser) (vgl. microm 2016, S. 26). Die Anzahl der Häuser wird auf Grundlage der
Straßenabschnitte für alle übergeordneten Gebietsebenen ermittelt. Basierend auf
Unternehmensregistern werden für jedes Haus Aussagen zu der Anzahl der Gewerbebetriebe
gemacht.
For data privacy reasons, houses within a residential environment are summed
up to a "virtual" micro-geographic segment (so-called micro-cell), which on average
comprises eight, but at least five households. Houses in which at least five
households live become a distinct micro-cell, while houses with less than five
households are combined with similar houses on the same street. Combined houses are as
close as possible in spatial terms. Structural indicators are aggregated on the micro
cell level and subsequently computed household level averages are computed (microm
2016, p.8). If such data exist, the calculated data is made consistent with official
data sources (microm 2014, p. 2). Additionally, due to the cooperation with SOEP, it
is possible to validate the small scale regional data of microm (microm 2016, p. 8).
The dataset is based on the variable group microm-Basis which is comprised of four
categories: number of households, number of business enterprises, number of houses
(including those purely used for business), and number of residential houses
(excluding those purely used for business) (cf. microm 2016, p. 26). The number of
houses on the street segment level is the basis for all aggregations to other regional
levels. Based on business registers, the number of enterprises in each house is
determined.
In die Datenerstellung fließen mehr als eine Milliarde Einzelinformationen ein.
Diese Daten liegen anonymisiert vor und werden von mehreren Quellen bezogen. Die
einfließenden Daten liegen grundsätzlich für sämtliche 40.9 Mio. Haushalte in Deutschland
vor und werden für die rund 20 Mio. Häuser ausgewiesen (microm 2016, S. 8).
Microm uses more than a billion individual data points for the aggregation of the
microm dataset. These are anonymised and stem from various data sources. The data points
are available for all 40.9 million households in Germany, while the final data product
contains information on approximately 20 million houses (microm 2016, p. 8).