UNEKE - Umfrage zur Speicherpraxis und Speicherbedarfen für Forschungsdaten UNEKE - Survey on Storing Practice and Storing Requirements for Research Data

DOI

UNEKE ist ein vom Bundesministerium für Bildung und Forschung gefördertes Verbundprojekt der Universität Duisburg-Essen und der RWTH Aachen. Unter der Federführung der Universitätsbibliothek Duisburg-Essen hat das Projekt zum Ziel, einen strategischen Ansatz für ein zukunftsgerichtetes Forschungsdatenmanagement für Institutionen zu entwickeln. Zur Bedarfserhebung führte UNEKE eine Umfrage durch, um sowohl die aktuelle Speicherpraxis als auch die Speicherbedarfe an den Hochschulen zu ermitteln. Es beteiligten sich deutschlandweit 13 Hochschulen an der Umfrage. UNEKE zielte insbesondere in der wissenschaftlichen Begleitstudie auf die Frage, was Forschende abhält bzw. ermutigt zukünftig Daten zu publizieren und zu teilen. Um die hinderlichen und unterstützenden Faktoren der Praxis offener Daten in der Hochschulbildung zu ermitteln, wurde eine groß angelegte Studie mit einem Online-Fragebogen konzipiert und durchgeführt. Ziel der quantitativen Methode war es, deskriptives Wissen über den Status quo der Forscher zu den Praktiken und Anforderungen des Forschungsdatenmanagements zu sammeln und das vorgestellte Forschungsmodell zu testen und zu validieren. Daher wurde der Datensatz in zwei Teile gegliedert: Im ersten Teil (Teil eins) wurden die Teilnehmer anhand von beschreibenden Fragen zu ihrem Speicherverhalten befragt; im zweiten Teil (Teil zwei) wurden mit Hilfe wissenschaftlich valider Konstrukte mehr über die Einstellung der Nutzer zum Datenaustausch erfahren. In diesem Zusammenhang werden mehrere Prädiktoren für das Verhalten beim Datenaustausch gemessen, einschließlich der wahrgenommenen (Dis)Vorteile und Risikofaktoren. Teil eins der Umfrage war in zwei Sprachen verfügbar, Deutsch und Englisch. Der zweite Teil bestand aus verschiedenen Instrumenten, die entweder aus bereits validierten Instrumenten entnommen oder leicht modifiziert wurden. Alle verwendeten Instrumente wurden ursprünglich in englischer Sprache veröffentlicht. Um unerwünschte Effekte durch die Übersetzung zu vermeiden, wurde wie im Original die englische Form der Instrumente beibehalten und der zweite Fragebogenteil entsprechend in Englisch abgefragt. Im Mittelpunkt der Studie stehen Hochschulangehörige aus Deutschland. Der Datensatz enthält die Daten von Mitgliedern von zehn großen Universitäten (über 20.000 Mitglieder) und drei mittleren Universitäten (über 10.000 Mitglieder). Die Umfrage startete aufgrund interner Vorgaben nicht an allen teilnehmenden Universitäten gleichzeitig, so dass die Laufzeit der Umfrage zwischen März 2018 und Januar 2019 liegt.

Teil 1: Deskriptiver Fragebogen Themen: 1. Hintergrund Forschungsprojekt: Dauer eines typischen Forschungsprojektes (in Monaten); generierte Datenmenge eines typischen Forschungsprojektes (GB); Prozentanteil der Datenmenge in der Anfangsphase, der Zwischenphase und der Endphase des Forschungsprojektes; Speicherort der anfallenden Forschungsdaten (z.B. bei einem externen Datenzentrum, zentral auf einem Server der Hochschule, lokal auf dem dienstlichen Rechner, etc.); Prozentanteil der Gesamtdaten, mit denen der Befragte regelmäßig arbeitet (jeweils im ersten, zweiten und letzten Drittel des Forschungsprojektes); Prozentanteil der Gesamtdaten, die von mehreren Personen genutzt und bearbeitet werden; Anzahl der Personen, die gemeinsam an einem typischen Forschungsprojekt arbeiten; Prozentanteil der Gesamtdatenmenge, die im Sinne der guten wissenschaftlichen Praxis 10 Jahre bzw. 25 Jahre gespeichert werden sollte (jeweils im ersten, zweiten und letzten Drittel des Forschungsprojektes); Art der Archivierung eigener Forschungsdaten für mindestens 25 Jahre; Expertise im Institut/ Fachbereich mit Systemen oder Tools, die das Forschungsdatenmanagement unterstützten. 2. Allgemeines: Datenquellen (z.B. Beobachtungen und Experimente, Umfragen und Interviews, Metastudien, etc.); Art der anfallenden Datenformate; Serveradministration, Fileserver, Backup bzw. Archiv am Lehrstuhl vorhanden (Datenhaltung, inhaltliche Datenpflege); Stunden für Serveradministration; Wichtigkeit von Datenschutz; Anonymisierung von Daten im Zuge des Forschungsprozesses; Richtlinien oder Empfehlungen für den Umgang mit Forschungsdaten; Richlinien erfüllen; Zugriff auf eigene Daten; Protokoll über den Datenzugriff; Wichtigkeit der Regulierung des Datenzugriffs; externe Personen bzw. Institutionen, die Datenzugriff erhalten müssen; Veröffentlichung der Rohdaten nach der Erstverwertung; erfasste Metadaten; Schema oder Standard zur Erfassung der Metadaten. 3. Demographie: Fakultät; Position; Fachbereich; Selbsteinschätzung Kenntnisse im Bereich Forschungsdatenmanagement; Probleme in Bezug auf Forschungsdaten (z.B. veraltete Datenformate, etc.); gewünschte Serviceleistungen der Hochschule im Umgang mit Forschungsdaten. Zusätzlich verkodet wurde: Interview Nummer; Universität bzw. Fachhochschule; Sprache; Interviewmodus; Zeitpunkt des Interviewbeginns; Verweildauer auf den einzelnen Fragebogenseiten; Verweildauer gesamt; Versandzeitpunkt der Einladungsmail; Zeitpunkt der letzten Änderung des Datensatzes; Befragung abgeschlossen; Befragter hat Fragebogen nur angesehen ohne Pflichtfelder zu beantworten; Seite, die der Befragte zuletzt bearbeitet hat; letzte Seite, die im Fragebogen bearbeitet wurde; Anteil fehlender Antworten in Prozent und gewichtet nach Relevanz; Maluspunkte für schnelles Ausfüllen; Seriennummer (sofern verwendet). Teil 2: Konstrukte 1. Wahrgenommener Wert der gemeinsamen Nutzung von Primärforschungsdaten; Absicht, Daten zwischen Forschern zu teilen; Verhalten bei der gemeinsamen Nutzung von Daten; Einstellung zur gemeinsamen Nutzung von Daten. 2. Wahrgenommene Nachteile: Kosten der gemeinsamen Nutzung (Zeit, Aufwand, Ressourcen, Schwierigkeiten); Kosten für die Karriere (z. B. Verlust von Publikationsmöglichkeiten, gemeinsame Datennutzung kann dazu führen, dass eigene Forschungsideen von anderen Forschern gestohlen werden usw.). 3. Wahrgenommene Vorteile: Wechselvorteile; Netzwerkmöglichkeiten; Karrierevorteile. 4. Risikofaktoren: Angst, mit Kollegen konkurrieren zu müssen; Angst vor Missbrauch; Angst, den eigenen Wert zu verlieren; Angst vor Kontrollverlust. 5. Kontrollvariablen: Technologie-Affinität; normativer Einfluss; wahrgenommene Verfügbarkeit des Datenspeichers.

UNEKE is a joint project of the University of Duisburg-Essen and the RWTH Aachen University funded by the Federal Ministry of Education and Research. Under the leadership of the University Library Duisburg-Essen, the project aims to develop a strategic approach for a future-oriented research data management for institutions. UNEKE conducted a survey to determine both current storage practices and storage needs at universities. Throughout Germany, 13 universities took part in the survey. Especially in the accompanying scientific study, UNEKE aimed at the question of what keeps researchers busy and encourages them to publish and share data in the future. In order to identify the hindering and supporting factors in the practice of open data in higher education, a large-scale study with an online questionnaire was designed and carried out. The aim of the quantitative method was to collect descriptive knowledge about the status quo of researchers on the practices and requirements of research data management and to test and validate the presented research model. Therefore, the data set was divided into two parts: In the first part (part one), the participants were asked descriptive questions about their storage behaviour; in the second part (part two), scientifically valid constructs were used to learn more about the users´ attitudes towards data exchange. In this context, several predictors of data exchange behaviour are measured, including perceived (dis)benefits and risk factors. Part one of the survey was available in two languages, German and English. The second part consisted of different instruments, either taken from already validated instruments or slightly modified. All instruments used were originally published in English. In order to avoid undesired effects from the translation, the English form of the instruments was retained as in the original and the second part of the questionnaire was asked for in English. The study focuses on university members from Germany. The data set contains data from members of ten large universities (over 20,000 members) and three medium-sized universities (over 10,000 members). Due to internal requirements, the survey did not start at all participating universities at the same time, so that the survey will run between March 2018 and January 2019.

Part 1: Descriptive questionnaire Topics: 1. background research project: duration of a typical research project (in months); generated data volume of a typical research project (gigabyte); percentage of the data volume in the initial phase, the intermediate phase and the final phase of the research project; storage location of the research data (e.g. at an external data centre, centrally on a server of the university, locally on the official computer, etc.); data volume of a typical research project (gigabyte); data volume of a typical research project (gigabyte); data volume of a typical research project (gigabyte); data volume of a typical research project (gigabyte); data volume of a typical research project (gigabyte); data volume of a typical research project (gigabyte); data volume of a typical research project (gigabyte); data volume of a typical research project (gigabyte); data volume of a typical research project (gigabyte); data volume of a typical research project (gigabyte); data volume of a typical research project (gigabyte); percentage of total data with which the respondent works regularly (in the first, second and last third of the research project); percentage of total data used and processed by several persons; number of persons working together on a typical research project; percentage of total data volume which, in the sense of good scientific practice, is 10 years or more 25 years should be stored (in the first, second and last third of the research project); type of archiving of own frog data for at least 25 years; expertise in the institute/department with systems or tools that support research data management. 2. General: data sources (e.g. observations and experiments, surveys and interviews, meta-studies, etc.); type of data formats; server administration, file server, backup and/or archive available at the faculty (data storage, content data maintenance); hours for server administration; importance of data protection; anonymisation of data in the course of the research process; guidelines or recommendations for handling research data; guidelines to fulfil; access to own data; protocol on data access; importance of regulation of data access; external persons or institutions who need to gain access to data; publication of raw data after first use; metadata collected; schema or standard for collecting metadata. Demography: faculty; position; department; self-assessment knowledge of research data management; problems related to research data (e.g. outdated data formats, etc.); desired services of the university in handling research data Additionally coded were: Interview number; university or university of applied sciences; language; interview mode; time of the start of the interview; time spent on the individual questionnaire pages; total time spent; time of sending the invitation email; time of the last change to the data set; survey completed; respondent only viewed questionnaire without answering mandatory fields; page that the respondent last edited; last page that was edited in the questionnaire; proportion of missing answers as a percentage and weighted according to relevance; penalty points for quick completion; serial number (if used). Part 2: Constructs 1. Perceived value in sharing primary research data; intention to share data between researchers; data sharing behaviour; attitude towards data sharing. 2. Perceived pains: sharing cost (time, effort, resources, difficult); career cost (e.g. losing publication opportunities, data sharing may cause own research ideas to be stolen by other researchers, etc.). 3. Perceived gains: switching benefits; network possibilities; career benefit. 4. Risk factors: fear of having to compete with colleagues; fear of misuse; fear of losing one’s unique value; fear of losing control. 5. Control variables: technology affinity; normative influence; perceived availability of data repository.

Self-administered questionnaire: Web-based

Wissenschaftler und Mitarbeiter von 13 teilnehmenden Universitäten in Deutschland

Researchers and employees of 13 participating universities in Germany

Vollerhebung; Auswahlverfahren Kommentar: Vollerhebung der Wissenschaftler und Mitarbeiter der Universitäten Duisburg-Essen, Bonn, Ruhr-Universität Bochum, Universität Köln Heinrich-Heine-Universität Düsseldorf, Technische Hochschule Köln, Universität Siegen, Universität Hildesheim, Bergische Universität Wuppertal, Fachhochschule Bielefeld, Rheinisch-Westfälische Technische Hochschule Aachen, Fachhochschule Aachen und Hochschule Bonn-Rhein-Sieg.

Identifier
DOI https://doi.org/10.4232/1.13327
Related Identifier IsNewVersionOf https://doi.org/10.4232/1.13321
Metadata Access https://api.datacite.org/dois/10.4232/1.13327
Provenance
Creator Wilms, Konstantin; Brenger, Bela; Lopéz, Ania; Rehwald, Stephanie; Stieglitz, Stefan
Publisher GESIS Data Archive
Contributor Principal Investigator
Publication Year 2020
Rights Alle im GESIS DBK veröffentlichten Metadaten sind frei verfügbar unter den Creative Commons CC0 1.0 Universal Public Domain Dedication. GESIS bittet jedoch darum, dass Sie alle Metadatenquellen anerkennen und sie nennen, etwa die Datengeber oder jeglichen Aggregator, inklusive GESIS selbst. Für weitere Informationen siehe https://dbk.gesis.org/dbksearch/guidelines.asp?db=d; All metadata from GESIS DBK are available free of restriction under the Creative Commons CC0 1.0 Universal Public Domain Dedication. However, GESIS requests that you actively acknowledge and give attribution to all metadata sources, such as the data providers and any data aggregators, including GESIS. For further information see https://dbk.gesis.org/dbksearch/guidelines.asp
OpenAccess true
Representation
Language German
Resource Type Dataset
Version 2.0.0
Discipline Social Sciences
Spatial Coverage Germany