Sozioökonomische Daten auf Rasterebene (SUF 6.1). Ethno Socio-economic data on grid level (SUF 6.1). Ethno

Dataset

DOI

Grundlage für die Variablengruppe Ethno bildet eine Vor- und Nachnamenanalyse hinsichtlich ihrer sprachlichen Herkunft und liefert demzufolge die Sprachabstammung von Personen. Die Auswertung der Namen basiert dabei auf Listen, in denen die sprachliche Abstammung der Namen verzeichnet ist. Zusätzlich werden diese Listen durch internationale Namensverzeichnisse ergänzt. Die Namensanalyse bezieht sich jeweils auf den Haushaltsvorstand. Es können keine Aussagen darüber getroffen werden, wie viele Personen tatsächlich eine ausländische Herkunft haben, wie lange die Person bereits in Deutschland lebt, oder wie ihre sozialen Anbindungen in Deutschland sind. Für die Variablengruppe "Ethno" können auf Grundlage der Analyse folgende Sprachabstammungen gebildet werden: Türkei, Italien, Griechenland, Spanien/Portugal/Lateinamerika, Spätaussiedler aus der früheren Sowjetunion, Osteuropa, Balkan, Afrika südlich der Sahra, außereuropäische islamische Staaten und Süd-, Ost- und Südostasien (microm 2016, S. 40). Die Variablengruppe "Ethno" wird ursprünglich auf PLZ-8 Ebene ausgewiesen und für den Datensatz auf das Raster heruntergerechnet (microm 2016, S. 40).

The variable group ethno is based an analysis of fore- and surnames with respect to their linguistic origin. The evaluation is based on lists of names and their origin, which are supplemented by international name roll of names. It only considers the head of the households. Thus, this does not allow for conclusions about the actual number of persons with a foreign origin, how long the individuals have already been Germany, and how strong the social integration is. For the variable “ethno” the following linguistic origins can be formed: Turkey, Italy, Greece, Span/Portugal/Latin America, ethnic German repatriates (Spätaussiedler) from the former Soviet Union, Eastern Europe, the Balkans, Africa south of the Sahara, non-European Islamic states, South-, East- and Southeast-Asia (microm 2016, p. 40). This variable group is originally calculated on the “8-digit post code” (PLZ8) level and is disaggregated to the raster used by this dataset (mircom 2016, p. 40).

RWI-GEO-GRID

Other

Aus Gründen des Datenschutzes werden mehrere zu einem Wohnfeld gehörende Häuser zu einer sogenannten Mikrozelle zusammengeführt. Diese Mikrozellen beinhalten mindestens fünf, durchschnittlich acht Haushalte. Dabei bilden größere Häuser, in denen mehr als fünf Haushalte leben ihr eigenes Segment. Häuser mit weniger als fünf Haushalten werden mit vergleichbaren Häusern in der gleichen Straße zusammengefasst, so dass die Mikrozelle dann mindestens fünf Haushalte umfasst. Die zusammengefassten Häuser weisen eine größtmögliche räumliche Nähe auf. Zudem werden Strukturindikatoren für die jeweilige Mikrozelle verdichtet, und die Information wieder pro Haushalt als Datei aufbereitet (microm 2016, S. 8). Wann immer dies möglich ist, werden die errechneten Daten mit anderen Datenquellen wie beispielsweise amtlichen Daten, die auf einer höheren Aggregationsstufe vorliegen, abgeglichen (microm 2014, S. 2). Zudem ermöglicht die Zusammenarbeit des SOEP und microm eine inhaltliche Beschreibung sowie Validierung der kleinräumigen microm Daten (microm 2016, S. 8). Die Basis des Datensatzes bildet die Variablengruppe microm-Basis. Diese ist in die folgenden vier Unterklassen unterteilt: Anzahl der Haushalte, Anzahl der Gewerbebetriebe, Anzahl der Häuser (inklusive reiner Gewerbehäuser) und Anzahl der Wohngebäude (exklusive reiner Gewerbehäuser) (vgl. microm 2016, S. 26). Die Anzahl der Häuser wird auf Grundlage der Straßenabschnitte für alle übergeordneten Gebietsebenen ermittelt. Basierend auf Unternehmensregistern werden für jedes Haus Aussagen zu der Anzahl der Gewerbebetriebe gemacht.

For data privacy reasons, houses within a residential environment are summed up to a "virtual" micro-geographic segment (so-called micro-cell), which on average comprises eight, but at least five households. Houses in which at least five households live become a distinct micro-cell, while houses with less than five households are combined with similar houses on the same street. Combined houses are as close as possible in spatial terms. Structural indicators are aggregated on the micro cell level and subsequently computed household level averages are computed (microm 2016, p.8). If such data exist, the calculated data is made consistent with official data sources (microm 2014, p. 2). Additionally, due to the cooperation with SOEP, it is possible to validate the small scale regional data of microm (microm 2016, p. 8). The dataset is based on the variable group microm-Basis which is comprised of four categories: number of households, number of business enterprises, number of houses (including those purely used for business), and number of residential houses (excluding those purely used for business) (cf. microm 2016, p. 26). The number of houses on the street segment level is the basis for all aggregations to other regional levels. Based on business registers, the number of enterprises in each house is determined.

In die Datenerstellung fließen mehr als eine Milliarde Einzelinformationen ein. Diese Daten liegen anonymisiert vor und werden von mehreren Quellen bezogen. Die einfließenden Daten liegen grundsätzlich für sämtliche 40.9 Mio. Haushalte in Deutschland vor und werden für die rund 20 Mio. Häuser ausgewiesen (microm 2016, S. 8).

Microm uses more than a billion individual data points for the aggregation of the microm dataset. These are anonymised and stem from various data sources. The data points are available for all 40.9 million households in Germany, while the final data product contains information on approximately 20 million houses (microm 2016, p. 8).

Identifier
DOI	https://doi.org/10.7807/microm:ethno:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:hstruktur:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:pkwseg:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:kaufkraft:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:pkwmarken:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:auslaender:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:haustyp:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:kinder:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:einwohner:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:einwgeal:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:alq:suf:v6:1
Related Identifier	IsSupplementedBy https://doi.org/10.7807/microm:zahlindex:suf:v6:1
Related Identifier	Continues https://doi.org/10.7807/microm:ethno:suf:v5:1
Related Identifier	IsVariantFormOf https://doi.org/10.7807/microm:ethno:v6
Related Identifier	IsDocumentedBy http://hdl.handle.net/10419/97627
Related Identifier	IsDocumentedBy https://doi.org/10.1007/s13147-015-0356-5
Related Identifier	IsDocumentedBy https://doi.org/10.4419/86788734
Metadata Access	https://api.datacite.org/dois/10.7807/microm:ethno:suf:v6:1

Provenance
Creator	RWI; Microm
Publisher	RWI – Leibniz Institute for Economic Research
Contributor	Budde, Rüdiger; Eilers, Lea; Microm Micromarketing-Systeme Und Consult GmbH; RWI – Leibniz-Institut Für Wirtschaftsforschung
Publication Year	2018
Rights	microm Micromarketing-Systeme und Consult GmbH
OpenAccess	true

Representation
Language	German
Resource Type	Dataset
Format	Stata
Size	170194 KB
Version	1
Discipline	Social Sciences
Spatial Coverage	Germany