Article
Samply.MDR – Ein Open-Source-Metadaten-Repository
Search Medline for
Authors
Published: | August 8, 2016 |
---|
Outline
Text
Hintergrund: In der medizinischen Forschung ist es je nach Fragestellung erforderlich, die benötigten Daten institutionsuübergreifend zu sammeln, z.B. aufgrund von kleinen Fallzahlen im Bereich der Seltenen Erkrankungen. Üblicherweise unterscheiden sich aber die gesammelten Datensätze in Format und Struktur – einerseits aufgrund einer lokal variierenden Dokumentationspraxis und andererseits aufgrund dessen, dass diese mit ursprü̈nglich unterschiedlichen Zielsetzungen erhoben worden sind – und müssen so transformiert werden, dass diese miteinander vergleichbar und damit gesamtheitlich analysierbar sind. Dies ist jedoch nur möglich, wenn ausreichend Informationen darüber vorliegen, wie die Daten korrekt zu interpretieren sind. Häufig ist eben diese Information jedoch nicht öffentlich einsehbar, z.T. sogar ü̈berhaupt nicht verfü̈gbar [1].
Methoden: Diese Informationen werden unter dem Begriff Metadaten zusammengefasst und in einem sogenannten Metadaten-Repository (MDR) bereitgestellt, bestenfalls an einer zentralen, öffentlich zugä̈nglichen und institutionsübergreifenden Stelle. Der ISO-Standard 11179 [2], im Besonderen Teil 3 in der Version 3, skizziert, unabhängig von einer konkreten Anwendungsdomä̈ne, Aufbau und Funktionsweise eines MDRs sowie das Format und die Struktur der darin verwalteten Metadaten. Die grundlegende Idee dabei ist, mö̈glichst umfassend zu spezifizieren, wie sich ein Attribut oder auch Datenelement charakterisieren und interpretieren lässt.
Ergebnisse: Bei der Entwicklung des Samply.MDR stand zunächst der möglichst ö̈ffentliche Zugriff auf Datenelementspezifikationen im Vordergrund. Entsprechend ISO 11179 umfassen diese u.a. die folgenden Metadatenattribute: Bezeichnung und ausfü̈hrliche Definition, den Datentyp sowie den zulässigen Wertebereich.
Da bereits andere MDR-Lösungen existierten und es das Ziel war, die Anwender zur Wiederverwendung von Datenelementspezifikationen zu motivieren – anstatt diese immer wieder neu zu definieren – wurde von vornherein berü̈cksichtigt, ü̈ber einen Adapter weitere MDRs anbinden zu kö̈nnen. So standen bereits zu Beginn viele Datenelementspezifikationen zur Verfügung, die in diesem Sinne von den Benutzern wiederverwendet werden konnten. Der in der bisherigen Implementierung umgesetzte Adapter für das caDSR des National Cancer Institutes [3] erlaubt es, aus dem Samply.MDR heraus dort nach Datenelementen zu suchen, ein mö̈glicherweise passendes von dort zu importieren – dabei wird ein Verweis auf das ursprüngliche Datenelement angelegt – und die Metadaten dabei noch anzureichern, z.B. durch eine Übersetzung ins Deutsche.
Der Zugriff auf die im MDR hinterlegten Metadaten kann einerseits ü̈ber eine grafische Benutzungsoberflä̈che und andererseits über eine REST-Schnittstelle erfolgen. Eine entsprechende Integration erfolgt in der CCP-IT des DKTK [4] und dem OSSE-Registerbaukasten [5]. Die Dokumentationen zur REST-Schnittstelle sowie zur Installation einer MDR-Instanz finden sich unter [6]. Ende 2015 ist der Quellcode des Samply.MDR unter der AGPL-Lizenz [7] als Open Source verö̈ffentlicht worden und kann unter [8] abgerufen werden. Dort ist es ebenfalls mö̈glich und auch gewünscht, etwaige Fehler zu melden und Codebeiträ̈ge einzureichen, um die Weiterentwicklung des MDRs praxis- und communitygetrieben voranzutreiben.
Zusammenfassung: Der aktuelle Stand der Implementierung kann es den Verantwortlichen erleichtern, die von Dritten erhaltenen Daten mit den eigenen oder denjenigen von weiteren Dritten zu integrieren, um diese gesamtheitlich auswerten zu können. Dabei handelt es sich aber um einen manuellen Prozess. Die dabei definierten Abbildungsvorschriften zwischen Datenelementen sollen zukünftig jedoch auch im MDR gespeichert werden, um eine zumindest teilautomatisierte Datenintegration zu ermö̈glichen: Neben einer passenden Entsprechung für ein Datenelement könnte auch eine Transformationsregel (z.B. Umrechnung zwischen Maßeinheiten) abrufbar sein.
Literatur
- 1.
- Dugas M, Jöckel KH, Friede T, Gefeller O, Kieser M, Marschollek M, Ammenwerth E, Röhrig R, Knaup-Gregori P, Prokosch HU. Memorandum "Open Metadata". Open Access to Documentation Forms and Item Catalogs in Healthcare. Methods Inf Med. 2015;54(4):376-8. DOI: 10.3414/ME15-05-0007
- 2.
- ISO/IEC 11179, Information Technology – Metadata registries (MDR). http://metadata-standards.org/11179/. Letzter Zugriff 08.03.2016.
- 3.
- Komatsoulis GA, Warzel DB, Hartel FW, Shanbhag K, Chilukuri R, Fragoso G, Coronado Sd, Reeves DM, Hadfield JB, Ludet C, Covitz PA. caCORE version 3: Implementation of a model driven, service-oriented architecture for semantic interoperability. J Biomed Inform. 2008 Feb;41(1):106-23. DOI: 10.1016/j.jbi.2007.03.009
- 4.
- Lablans M, Kadioglu D, Muscholl M, Ückert F. Exploiting Distributed, Heterogeneous and Sensitive Data Stocks while Maintaining the Owner's Data Sovereignty. Methods Inf Med. 2015;54(4):346-52. DOI: 10.3414/ME14-01-0137
- 5.
- Muscholl M, et al. OSSE – open source registry software solution. Orphanet J Rare Dis. 2014;9 Suppl 1:O9. DOI: 10.1186/1750-1172-9-s1-o9
- 6.
- The Samply Metadata Repository. https://doc.samply.de/mdr/. Letzter Zugriff 08.03.2016.
- 7.
- GNU Affero General Public License. https://www.gnu.org/licenses/agpl-3.0.html. Letzter Zugriff 08.03.2016.
- 8.
- Source Code Repository of the Samply.MDR. https://code.samply.de/mdr. Letzter Zugriff 08.03.2016.