Grundlage für die Variablengruppe "Ethno" bildet eine Vor- und Nachnamenanalyse hinsichtlich ihrer sprachlichen Herkunft. Die Auswertung der Namen basiert dabei auf Listen, in denen die sprachliche Abstammung der Namen verzeichnet ist. Zusätzlich werden diese Listen durch internationale Namensverzeichnisse ergänzt (microm 2014, S. 96f.). Die Namensanalyse bezieht sich jeweils auf den Haushaltsvorstand. Dementsprechend können keine Aussagen darüber getroffen werden, wie viele Personen tatsächlich eine ausländische Herkunft haben, wie lange die Person bereits in Deutschland lebt, oder wie ihre sozialen Anbindungen in Deutschland sind. Für die Variablengruppe "Ethno" können auf Grundlage der Analyse folgende Sprachabstammungen gebildet werden: Türkei, Italien, Griechenland, Spanien/Portugal/Lateinamerika, Spätaussiedler aus der früheren Sowjetunion, Osteuropa, Balkan, Afrika südlich der Sahra, außereuropäische islamische Staaten und Süd-, Ost- und Südostasien (microm 2014, S. 96f.). Die Variablengruppe "Ethno" wird ursprünglich auf PLZ-8 Ebene ausgewiesen und für den Datensatz auf das Raster heruntergerechnet.
The variable group “ethno” is based an analysis of fore- and surnames with respect to their linguistic origin. The evaluation is based on lists of names and their origin, which are supplemented by international name roll of names. It only considers the head of the households. Thus, this does not allow for conclusions about the actual number of persons with a foreign origin, how long the individuals have already been Germany, and how strong the social integration is. For the variable “ethno” the following linguistic origins can be formed: Turkey, Italy, Greece, Span/Portugal/Latin America, ethnic German repatriates (Spätaussiedler) from the former Soviet Union, Eastern Europe, the Balkans, Africa south of the Sahara, non-European Islamic states, South-, East- and Southeast-Asia (microm 2014, p. 96). This variable group is originally calculated on the “8-digit post code” (PLZ8) level and is disaggregated to the raster used by this dataset.
RWI-GEO-GRID
Other
Microm verwendet schätzungsweise über eine Milliarde Einzelinformationen, die in den microm Datensatz einfließen. Die Grundlage für die Informationsgewinnung bilden im Wesentlichen Informationen über ca. 40,7 Millionen Haushalte in Deutschland.
Mircom uses more than a billion individual datapoints for the aggregation of the microm dataset. These are mainly information on approximately 40.7 million households in Germany.
Die Daten werden nicht für die einzelnen Haushalte sondern für die rund 19,7 Millionen Häuser in Deutschland ausgewiesen (microm 2014, Seite 1). Aus datenschutzrechtlichen Gründen werden Häuser, die zu einem Wohnumfeld gehören, zu einem „virtuellen“ mikrogeografischen Segment (sog. Mikrozelle) gebündelt, das durchschnittlich acht, mindestens aber fünf Häuser umfasst. So werden aus den benutzten Grunddaten Informationen zu den Haushaltsstrukturen generiert, die dann wiederum in weitere Hochrechnungen einfließen. Wann immer dies möglich ist, werden die errechneten Daten mit anderen Datenquellen wie beispielsweise amtlichen Daten, die auf einer höheren Aggregationsstufe vorliegen, abgeglichen (microm 2014, S. 2). Darüber hinaus nutzt microm die Möglichkeit seine Wohnumfelder zu geocodieren, das heißt, den Wohnfeldern werden Koordinaten zugewiesen. Dadurch wird die Möglichkeit geschaffen, diese Informationen den einzelnen Rastern zuzuordnen und auf dieser Ebene zu aggregieren.