Skalierbare Datenqualität in anwendungsspezifischen Szenarien∗ Matthias Virgin Tobias Umblia Andreas Heuer DZNE e.V. Bonn Universität Rostock Universität Rostock Standort Rostock / Greifswald Institut für Informatik Institut für Informatik Gehlsheimer Str. 20 Lehrstuhl für Datenbank und Lehrstuhl für Datenbank und 18147 Rostock Informationssysteme Informationssysteme matthias.virgin@dzne.de 18051 Rostock 18051 Rostock tu@informatik.uni- heuer@informatik.uni- rostock.de rostock.de ABSTRACT zutreffenden oder fehlenden Daten kann in verschiedenen Konzepte der Datenqualität haben sich neben vielen Diszi- Situationen und Anwendungsszenarien den täglichen Um- plinen auch im Umfeld der Informationstechnologie etabliert gang mit den Daten und deren Infomationsgehalt erschwe- und somit einen festen Platz in Aspekten der Entwicklung ren und führt zu falschen Ergebnissen in der Bearbeitung neuer Informationssysteme eingenommen. Das Vorhanden- [2]. Falsche Ergebnisse, die z.B. im medizinischen Bereich sein vieler unterschiedlicher objektiver und subjektiver An- Diagnosen darstellen, können durch falsche Behandlungen forderungen an die Qualität von Daten zwingt den Entwick- sogar gesundheitsschädliche Folgen mit sich führen. Auch ler mittlerweile dazu, einen immer größeren Teil seiner Ent- auf dem Wirtschaftssektor können Entscheidungen aufgrund wicklungszeit für die Modellierung von Konzepten zur Qua- fehlerhafter Datenbestände zu gravierenden finanziellen und litätserfüllung zu verwenden. In diesem Beitrag wird eine personellen Auswirkungen führen. erste Idee vorgestellt, um diesen Aufwand frühzeitig zu ver- ringern. Dazu wird zunächst eine Betrachtung der sicher- Datenqualität ist somit ein unverzichtbarer Begleiter jeg- heitsrelevanten Qualitätsfaktoren vorgenommen. Daraufhin licher Informationssysteme. Ursprünglich und auch heute erfolgt eine anwendungsspezifische Einordnung der Quali- noch hat das Konzept der Datenqualität in der Integration tätskriterien in Gruppen ähnlicher Charakteristika mit an- heterogener Datenbestände einen besonders hohen Stellen- schließender Skalierung. Somit besteht die Möglichkeit ein- wert. Aber natürlich sind auch für jedes andere Software- zelne Gruppen mit besonders hohen Qualitätsbedürfnissen system die Techniken zur Erhöhung der Datenqualität ein- zu identifizieren und zu behandeln. Ressourcen können da- setzbar und empfehlenswert [9]. Deshalb ist schon bei der durch von Anfang an schonender und auf bestimmte Quali- Planung von Softwaresystemen, unabhängig vom Anwen- tätskriterien hin gezielter eingesetzt werden. dungsszenario, darauf zu achten, dass von vornherein ein verstärkter Blick auf die Datenqualität gerichtet wird. Qua- Categories and Subject Descriptors lität bedeutet eine bestimmte Eignung für einen Zweck. Das H.1.1 [Systems and Information Theory]: Value of in- heißt, dass für jeden Zweck der Qualitätsbegriff bzw. dessen formation Ausprägung neu bestimmt werden muss [4]. Damit wird aus- gesagt, dass jedes Anwendungsszenario einen anderen Blick- winkel auf bestimmte Qualitätsaspekte von Daten besitzt. Keywords Das bedeutet, dass jedes Szenario und dessen Zielsetzung Datenqualität, Qualitätsbewertung, Qualitätsmodell im Hinblick auf den Einsatz bestimmter Methoden und Kon- zepte der Datenqualität immer wieder neu diskutiert werden 1. MOTIVATION muss. Diese Maßnahmen resultieren aus den verschiedenen Die Qualität von Daten hat schon seit längerer Zeit einen Anforderungen an die Datenqualität, die in einem besonde- hohen Stellenwert auf dem Gebiet der Informationsverarbei- ren Maße betrachtet werden müssen. In der Literatur werden tung erlangt. Die große Problematik von verfälschten, un- zwar Vollständigkeit, Fehlerfreiheit, Konsistenz und Aktua- ∗Copyright is held by the authors. lität als besonders wichtige Anforderungen beschrieben; die- se können aber in unterschiedlichen Anwendungsszenarien, GvD Workshop’10, 25.-28.05.2010, Bad Helmstedt, Germa- ny. neben weiteren Anforderungen, verschieden wichtige Stel- lungen einnehmen. Bei geografischen Anwendungen ist es z.B. die spezielle Anforderung an die Positionsgenauigkeit, die einen sehr hohen Stellenwert besitzt, aber in kaum ei- nem anderen Anwendungsszenario wichtig ist [6], oder auch Forderungen nach referenzieller Integrität als Qualitätsan- forderung an relationale Datenbanken [2]. Die Datenqualität ist durch die Anforderungen an sie mess- bar. Also sind die Anforderungen auch messbar. Somit soll- ten eher applikations- oder kundenbezogene Anspruchsnive- aus (Soll-Wert) auf Anforderungen definiert werden, an de- nen die Qualität der Daten im laufenden Prozess beurteilt werden kann [2]. Somit kann es kein allgemeines Qualitäts- modell für Daten bei der Entwicklung von Softwaresystemen geben. Deshalb stellen wir hier einen Lösungsansatz vor, der ein objektives Vorgehen definiert ohne die benötigten dy- namischen Aspekte einzelner Anwendungsszenarien zu ver- nachlässigen. Figure 1: Qualitätsmodell nach Hinrichs [3] 2. STAND DER TECHNIK Eingangs wurde bereits die Möglichkeit einer Gruppierung 80% der befragten IT-Manager durch Wang hätten ebenfalls von Qualitätsdimensionen erwähnt. Diese Idee, als Quali- diese Kategoriserung gewählt [9, 10]. Diese erste Systema- tätsmodell benannt, ist an sich nichts Neues. Um einen Über- tisierung machte es möglich Datenqualität auf einer struk- blick über vorhandene Modelle und deren Charakteristika zu turierten Ebene zu behandeln, zu steuern, zu messen und geben, führen wir anschließend vier von ihnen an. im Anschluß daran auch zu bewerten. Auf Grundlage die- ses Modelles sind viele weitere Modelle entstanden, die sich Mitte der 1990er Jahre wurde durch Wang und Strong eine in ihrer Zerlegungssemantik unterscheiden und somit auch Befragung bei IT-Managern durchgeführt [10]. Diese sehr oft Unstimmigkeiten untereinander erzeugen. Es seien an dieser zitierte Umfrage ergab als Ergebnis einen Umfang von 179 Stelle noch 3 weitere Modelle genannt, die in der Literatur Anforderungen an die Qualität von Daten. Von den Autoren erhöhtes Interesse aufweisen. wurden anschließend 15 Anforderungen ausgewählt, die von der Mehrzahl der Befragten genannt wurden. Ein Modell, dass direkt von Wang abgeleitet ist, ist das von Felix Naumann (2002). Er veränderte die Kategorien (leicht, Ein Großteil der heutigen Autoren geht von annähernd die- nach eigenen Aussagen) und die Einordnung der Dimensio- sen 15 grundlegenden, allgemeinen Anforderungen, den so- nen (teilweise anders benannt) und bemerkte zudem, dass genannten Qualitätsdimensionen, aus. Auch wenn diese in viele Kriterien immer noch sehr subjektiv geprägt seien und diversen Publikationen oft syntaktisch unterschiedlich er- eine feste Definition deshalb auch nicht sinnvoll erscheint [4]. scheinen, eröffnet die Kurzerklärung meist einen semanti- schen Zusammenhang. Die in Deutschland gebräuchlichen Dimensionen1 wurden durch die Deutsche Gesellschaft für • Inhaltsbezogene Kriterien (Interpretierbarkeit, Doku- Informations- und Datenqualität auf Grundlage von Robert mentation, ...) Wang [10] erstellt. Dabei wurden sie ins Deutsche übersetzt und mit festen Definitionen versehen. Ein Ziel dieser Fest- • Technische K. (Verfügbarkeit, Preis, ...) legung war, dass Dimensionen so ausgelegt werden, dass sie zum einen überschneidungsfrei sind und zum anderen ent- • Intellektuelle K. (Glaubwürdigkeit, Reputation, ...) weder einzeln oder in eindeutiger Kombination miteinander verwendet werden können [9]. • Instanzbezogene K. (Datenmenge, Verständlichkeit, ...) Die Autoren äußerten sich zusätzlich zu einer Kategorisie- rung der Dimensionen nach bestimmten Merkmalen. Das Allerdings, so Naumann, ist eine solche Liste nützlich, um Ergebnis von Wang und Strong war eine erste Zerlegungsse- für bestimmte Anwendungen die relevante Teilmenge aus mantik, die die Dimensionen in 4 Kategorien nach folgendem den Kategorien festlegen zu können [4]. Es wird allerdings Muster einordnete: nicht auf die Art und Weise bzw. auf die Vorgehensgrundlage sowie auf die weiterführende Zerlegungssemantik eingegan- gen. • Informationszugang (Systemzugang, Zugangssicherheit) Um noch einmal, wie in der Motivation schon einleitend erwähnt, zu verdeutlichen, dass bestimmte Szenarien ne- • Darstellung (Interpretierbarkeit, Verständlichkeit, Ma- ben den grundsätzlich wichtigen Dimensionen, wie z.B. Voll- nipulationsfähigkeit, Integrität und Widerspruchsfrei- ständigkeit und Fehlerfreiheit, auch anwendungsspezifische heit) Dimensionen nutzen, um die Relevanz anwendungsspezifi- scher Gegebenheiten auszudrücken, zeigt das Qualitätsmo- • Informationszusammenhang (Relevanz, Zusatznutzen, dell nach Hinrichs (Figure 1). Aktualität, Vollständigkeit, Informationsumfang) Hier finden sich in der rechten Kategorie die Dimensionen • Eigenwert (Richtigkeit, Objektivität, Glaubwürdigkeit, Schlüsseleindeutigkeit und Referenzielle Integrität, die spe- Reputation) ziell auf relationale Datenbanken ausgerichtet sind. Bei der 1 15 Qualitätsdimensionen: Zugänglichkeit, Angemessener Verbreitung relationaler Datenbanken wäre der Einsatz die- Umfang, Glaubwürdigkeit, Vollständigkeit, Übersichtlich- ses Modells allerdings nach [2] als legitim anzusehen. keit, Einheitliche Darstellung, Bearbeitbarkeit, Fehlerfrei- heit, Eindeutige Auslegbarkeit, Objektivität, Relevanz, Ho- Das letzte hier genannte Qualitätsmodell stellt das Referenz- hes Ansehen, Aktualität, Verständlichkeit, Wertschöpfung modell im deutschsprachigen Raum dar (Figure 2). Im Jahr 3. LÖSUNGSANSATZ 3.1 Rechtliche Anforderungen als Qualitäts- dimension Einige Autoren ([1, 10] etc.) führten innerhalb ihrer Qua- litätsdimensionen auch die der Sicherheit an. Grundlegend kann man sagen, dass die Dimension der Sicherheit“ inhalt- ” lich zu einem großen Teil aus Anforderungen an den Da- tenschutz bestehen und somit auch rechtliche Vorgaben wi- derspiegeln. Diese rechtlichen Vorgaben müssen erfüllt wer- Figure 2: Qualitätsmodell von der DGIQ [8] nach R. den und können, wie später in diesem Beitrag zu sehen, Wang [10] zunächst nicht in ihrer Wichtigkeit skaliert werden. Des- halb gehört unserer Meinung nach der rechtliche Teil der Dimension Sicherheit auch nicht zur Datenqualität. Aller- dings kann die Sicherheit auf Kundenwunsch hin über den 2007 überarbeite die Deutsche Gesellschaft für Informations- Anforderungen von rechtlichen Vorgaben oder leitliniener- und Datenqualität (DGIQ) die von Robert Wang ursprüng- stellenden Einrichtungen liegen. Wir sprechen hier von ei- lich 15 ermittelten Qualitätsdimensionen und übersetzte sie ner Übererfüllung von sicherheitsrelevanten Anforderungen, final“ ins Deutsche und passte die Definitionen an (eindeu- die wiederum einen qualitativen Charakter besitzen. Dieser ” tig, nach eigener Aussage) [8]. Die 4 Kategorien, die hier Mehrwert kann in Zahlen, und somit skaliert, ausgedrückt genutzt wurden, sind von der Zerlegungssemantik her dem werden und durch den erhöhten Schutz der Daten auch in- jeweiligen Untersuchungsgegenstand zugeordnet. Also sys- direkt die Qualität anderer Dimensionen erhöhen. Insofern ” temunterstützt zu System“, inhärent zu Inhalt“, darstel- werden wir in weiterer Betrachtung Aspekte der Sicherheit ” ” lungsbezogen zu Darstellung“ und zweckabhängig zu Nut- unabhängig der rechtlichen Anforderungen mit betrachten. ” zung“ [9]. Ungeachtet dessen haben die DGIQ und Autoren aktuel- ler Publikationen die Sicherheit aus den Qualitätsdimen- Die Anforderungen an die Qualität von Daten stellen eine sionen und deren Umfeld komplett entfernt. Wie wir aber Grundlage für die Messbarkeit und Bewertung der Qualität, im Stand der Technik festgestellt haben, sind diese Model- also der Eignung von Daten für einen bestimmten Zweck, le recht starr und unflexibel gegenüber anwendungsspezifi- dar. Die Messung und Bewertung von Qualität ist immer schen Szenarien. Deswegen sind wir der Meinung, dass man noch sehr stark subjektiv geprägt. Das wird belegt durch ge- in gewissen Szenarien die Sicherheit als zusätzliche Dimensi- nerelle Aussagen wie: Die Qualität von Daten ist dann gut, on mitbetrachten kann. Auch wenn die DGIQ die Sicherheit ” wenn Sie den Anforderungen an den Gebrauch der Daten als Dimension mit der Begründung entfernt hat, dass sie erfüllen.“ [1] oder: Die Qualität der erhobenen Daten ist zwar zu einer Qualitätssteigerung der restlichen Dimensio- ” abhängig von der Qualität der Erhebung.“ [7]. Die Qualität nen führt, aber als erschöpfend bewertet angesehen werden der Daten wird also immer an anderen Maßstäben gemessen. sollte [9], müsste man sie immer noch nebenher zu den beste- henden Dimensionen mit betrachten und nicht gänzlich aus Durch diese, wie schon erwähnt, meist subjektiven Bewer- dem Blickfeld dieser entfernen. Denn auch die Umsetzung tungen ist es erforderlich, zumindest eine objektive Vorge- rechtlich relevanter Sicherheitsmaßnahmen muss auf seine hensweise zu definieren, die die gesetzten Qualitätsdimen- Qualität hin überprüft und bewertet werden. sionen nutzt und diese dynamisch auf verschiedene Anwen- dungsszenarien anwendet. Die hier gezeigten Qualitätsmo- delle versuchen bzw. haben die einzelnen Qualitätsdimen- 3.2 Anwendungsspezifische Gruppen sionen in Kategorien zusammengefasst, um den Umgang mit In mehreren Arbeiten, wie auch in [4], wird davon gespro- ihnen zu erleichtern. Allerdings fallen 2 Aspekte auf: chen, dass für jede Anwendung die Qualität neu bewertet werden muss. Denn jedes Unternehmen und somit auch jedes Anwendungsszenario ist anders, so dass die Datenqualität 1. Spezifische Dimensionen Die Nutzung von anwen- nach [9] sinnvoll umgesetzt werden muss. Allerdings bleibt dungsspezifischen Dimensionen passt das Qualitätsmo- es meist bei diesen Aussagen. Ein konkreter weiterführen- dell für diese bestimmte Anwendung an, macht es aber der Vorschlag ist unseres Erachtens nicht eindeutig zu fin- gegenüber etablierten Modellen nicht vergleichbar. Er- den. Für unseren Ansatz gehen wir nicht von einer strikten fahrungswerte von vorhergehenden Modellen können anwendungsunabhängigen Einordnung der Dimensionen in so nicht übernommen werden. Kategorien aus, wie in den Qualitätsmodellen im Stand der Technik gezeigt. Eher schlagen wir vor, je nach Anwendungs- 2. Statische Modelle Die hier vorgestellten Modelle sind szenario eigene Kategorien zu erzeugen und die Dimensio- alle sehr statisch aufgebaut. Anwendungsspezifische Sze- nen angepasst an das Projektvorhaben einzusortieren. Die narien können damit nicht flexibel genug beschrieben Zerlegungssemantik ist also hier sehr flexibel angesetzt. Wir werden. nutzen dazu nur die 15 von der DGIQ vorgeschlagenen Di- mensionen, um eine gewisse Möglichkeit für Vergleiche bei- Unser Ziel ist die flexible Gruppierung durch vorhandene zubehalten. Eigens definierte Dimensionen, wie in Hinrichs und anerkannte Qualitätsdimensionen für anwendungsspezi- Modell [3], wollen wir vermeiden, damit begrifflich auf einer fische Szenarien. Und dies so, dass gesammelte Erfahrungs- Ebene gearbeitet werden kann. So kann man aber z.B. eine werte auf später folgende Modelle mit übernommen werden eigene Kategorie Referenzielle Integrität“ erzeugen, die mit ” können. bestimmten Qualitätsdimensionen durch Nutzer oder Ent- wicklerwünschen befüllt wird. Bei dieser sehr flexiblen Er- re Forderungen nach einer möglichst hohen Wertschöpfung stellung einer eigenen Zerlegungssemantik ist natürlich eine (Gruppe C) aus Sicht des Management (iv) unter verringer- sehr bewusste Auswahl der Qualitätsmerkmale und dessen ter Berücksichtigung aller anderen Gruppen. Einordnung in die Kategorien zu treffen. Durchaus kann es dabei vorkommen, dass einige Dimensionen gar nicht be- Die Größe der umschlossenen Fläche, die sich durch das Ver- trachtet werden, da sie für das Vorhaben nicht relevant sind binden der Punkte auf den Kategorieachsen gebildet hat, oder durch andere Dimensionen mit abgedeckt werden. Auch kann ein erstes Indiz für den mutmaßlichen Implementati- ist es durchaus denkbar, eine Qualitätsdimension mehreren onsaufwand darstellen, den die Umsetzung des Systems ver- Gruppen zuzuordnen, je nachdem, ob mehrere Kategorien ursachen wird, um allen Anforderungen an die Datenqualität ähnliche Qualitätsanforderungen besitzen. aus der Betrachtung gerecht zu werden. Zudem wird aus der grafischen Betrachtung ersichtlich, auf welche Bereiche sich Kategorie DQ Dimensionen der Entwickler zuerst konzentrieren sollte, da dies ja einen erhöhten Arbeitsaufwand vermuten lässt. A Zugänglichkeit, Bearbeitbarkeit, Aktuali- tät 3.4 Entwickler- und Nutzersichten B Übersichtlichkeit, Einheitliche Darstel- Nach [9] und [10] ist es zur Beschreibung und Bewertung lung, Verständlichkeit, Eindeutige Ausleg- von Informations- bzw. Datenqualität wichtig, die Quali- barkeit tät der Daten aus der Sicht der Nutzer zu ermitteln (fit C Wertschöpfung for use Konzept). Eine weitere Quelle [4] legt der Quali- D Relevanz tätsbewertung ein Qualitätsmodell zugrunde, dessen Sub- E Vollständigkeit, Fehlerfreiheit jekte (Nutzer), Prädikate (Anfrageverarbeitung) und Ob- F Objektivität, Glaubwürdigkeit, Hohes An- jekte (Datenquelle) nur ganz bestimmte Qualitätskriterien sehen bewerten, und zwar diejenigen, die laut Autor in der An- G Sicherheit, Vertraulichkeit wendung, Anfrageverarbeitung oder Datenquelle vorliegen. Es wird also überwiegend vom Nutzer ausgegangen, der die Table 1: Beispielhafte Gruppierung von Qualitätsdi- Qualitätsansprüche an die Daten vorgibt. Allerdings müsste mensionen (in Anlehnung an [8] und [5]). unseres Erachtens nach auch der Entwickler, der das System erstellt und eventuell auch unterhält, bei der Qualitätsbe- wertung nach unserem oben beschriebenen Vorgehen maß- In der Tabelle 1 haben wir exemplarisch die Dimensionen geblich unterstützend mitwirken. Das würde in der Praxis in 7 Gruppen nach einer einfachen Ähnlichkeit der Begrif- folgendermaßen aussehen. Anwender und Nutzer führen die fe der Dimensionen erstellt. Hier sind die Kategorien noch ersten zwei Schritte gemeinsam aus, dabei sollte der Ent- mit Buchstaben benannt, eine sinnvolle Namensgebung auf wickler durch seine Fachkompetenz die Richtung vorgeben. Grundlage bestimmter anwendungsszenarischer Anforderun- gen oder Gebiete ist natürlich möglich und erwünscht. 1. Kategorien bilden Für das anwendungsspezifische Szenario werden Kategorien gebildet, in denen die Qua- 3.3 Skalierung litätskriterien später eingeordnet werden. Diese Kate- Nachdem die Dimensionen in die selbst erstellten Katego- gorien können bestimmte Qualitätsaspekte der Anwen- rien eingeordnet wurden, macht es Sinn, diese nach ihrer dung namentlich darstellen. Wichtigkeit zu skalieren. Dazu kann man ihnen mehr oder weniger Punkte auf einer Skala zuordnen, um damit ihre Be- 2. Qualitätsdimensionen einfügen Die 15 festdefinier- deutung in Umfang, Wichtigkeit oder präferierter Behand- ten Dimensionen werden nach den Spezifika der An- lung zu kennzeichnen. Eine exemplarische Skalierung haben wendung in die Kategorien eingeordnet. wir in Abbildung 3) gegeben. Hier haben wir verschiedene 3. Skalierung der Kategorien Nutzer und Anwender globale Anwendungsbereiche definiert, die nach der Auftei- bewerten die Wichtigkeit der Kategorien nach ihrem lung aus Tabelle 1 skaliert wurden. Alle genannten Anwen- persönlichen Verständnis und ihrer Auffassung gegen- dungen haben die gleiche Aufteilung der Dimensionen in die über der Wichtigkeit und Präferenz der Dimensionen Kategorien erhalten. Denkbar ist natürlich auch die indi- in den Kategorien. viduelle Gruppenbildung bei den einzelnen Anwendungen. Für einen übersichtlichen Vergleich und die allgemeine Er- 4. Probleme identifizieren Beide System Layouts“ kön- ” läuterung unserer Idee ziehen wir diese Variante zunächst nen nun gegeneinander gehalten werden. Große Dif- vor. ferenzen zwischen Nutzer- und Entwicklerbewertung einzelner Kategorien identifizieren nochmalige Klärung Die verschiedenen System Layouts“ resultieren aus den ver- zum Bedarf und Einsatz bestimmter Konzepte zur Qua- ” litätsbehandlung der Daten. schiedenen Anforderungen in dessen Anwendungsgebiete. Ge- setzgeber und Behörden (i) legen mehr Wert auf Vollständig- keit, Objektivität und erhöhte Sicherheit (Gruppen E, F & Durch ein derartiges Vorgehen kann bei der Planung bzw. G). Die strengen Anforderungen für die Zugänglichkeit und Anforderungsanalyse einer Anwendung in Hinblick auf den Aktualität sowie die Fehlerfreiheit (Gruppen A & E) im Be- Einsatz des Qualitätsmanagements mit seinen Qualitätsdi- reich der Forschung (ii) oder der Einsatz in der alltäglichen mensionen von vornherein eine anwendungsspezifische Ab- (Berufs-)Praxis (iii), bei der das Wichtigste eine einfache Zu- stimmung zwischen Nutzer und Entwickler erfolgen. Allen gänglichkeit, Vollständigkeit und Objektivität (Gruppen A, Beteiligten kann dabei ein aussagekräftes Qualitätskonzept E & F) sind, können ebenso abgebildet werden, wie die kla- in die Hand gegeben werden. Figure 3: Verschiedene System Layouts“ bezüglich ihrer Anforderungen der Datenqualität im Bereich der ” i) Behörden, ii) Forschung, iii) (Berufs-)Praxis and iv) Management; mit Skalierung für 1 - wenig, 2 - viel, 3 - hohe Aufmerksamkeit bzgl. der enthaltenen Qualitätsdimensionen. 4. ZUSAMMENFASSUNG UND SCHLUSS- ausreichend Informationen bietet. Und zum Schluss steht ein FOLGERUNG genereller praktischer Einsatz noch aus. In diesem Beitrag haben wir das Feld der Datenqualität aufgegriffen und ein erstes theoretisches Konzept für den 5. REFERENCES Umgang mit Qualitätsdimensionen vorgestellt. Das generel- [1] M. Abate, K. Diegert, and H. Allen. A hierarchical le Ziel war es, Voraussetzungen für eine hohe Datenquali- approach to improving data quality. Data Quality, tät zu schaffen, die für ein anwendungsspezifisches Szena- 4(1):365–369, 1998. rio geeignet ist. Denn erst wenn die Funktionalitäten eines [2] D. Apel, W. Behme, R. Eberlein, and C. Merighi. Softwaresystems eine, vom Nutzer und Entwickler durch Di- Datenqualität erfolgreich steuern - Praxislösungen für mensionen spezifizierte, ausreichende Qualität besitzen, ist Business-Intelligence-Projekte. Carl Hanser Verlag die Funktionsfähigkeit eines IT-Systems gewährleistet [9]. München, 2009. [3] H. Hinrichs. Datenqualitätsmanagement in Data Hauptverursacher unzureichender Datenqualität ist und bleibt Warehouse-Systemen. PhD thesis, Carl von der Mensch. Deshalb war es wichtig, die von uns aus ersicht- Ossietzky-Universität Oldenburg, 2002. lichen Unzulänglichkeiten anderer Qualitätsmodelle aufzu- [4] U. Leser and F. Naumann. Informationsintegration. greifen und sie zu behandeln. Dazu haben wir die Dimen- dpunkt Verlag Heidelberg, 2007. sion der Sicherheit als Konzept einer Übererfüllung von Si- [5] F. Naumann and C. Rolker. Assessment methods for cherheitsbedürfnissen über den rechtlichen Vorgaben hinaus information quality criteria. In Proceedings of the 2000 in unsere Betrachtungen mit einbezogen. Die Einordnung International Conference on Information Quality von 15 fest definierten Dimensionen in selbst erstellte Ka- (ICIQ), pages 148–162, Cambridge, MA, 2000. tegorien, aus einem bestimmten Anwendungsszenario her- [6] A. Ostman. The specification and evaluation of spatial aus, erlaubt eine Wichtung dieser durch den Nutzer und data quality. ICA/ACI International Conference, 18, den Entwickler, um auf ein gemeinsames Qualitätslevel zu 1997. gelangen. Damit können Methoden und Werkzeuge in der [7] E. Poy. Objectives of QC systems and QA function in Anforderungsanalyse bestimmt werden, die die Umsetzung clinical research. Quality Assurance (San Diego, der ermittelten Qualitäten gewährleisten können. Für einen Calif.), 2(4):326–331, Dec. 1993. späteren Soll-Ist-Vergleich können die Wichtungen ebenfalls als Bewertungsgrundlage herangezogen werden. [8] J. Rohweder, G. Kasten, D. Malzahn, A. Piro, and J. Schmid. Information quality - definitions, Die nächsten Schritte für die Weiterentwicklung dieser Idee dimensions and terms. http://dgiq.de/ data/pdf/IQ- sind zunächst z.B. die Überprüfung, ob eine Mehrfachein- Definition/IQ-Definitionen.pdf, ordnung von Qualitätsdimensionen in spezielle Kategorien 2007. sinnvoll ist. Auch für die Benennung der Kategorien nach [9] J. Rohweder, G. Kasten, D. Malzahn, A. Piro, and den in jedem Anwendungsszenario unterschiedlichen Anfor- J. Schmid. Daten- und Informationsqualität. Vieweg derungen müsste der Einsatz bestimmter Reglements über- Teubner, 2008. prüft werden. Um einfache anwendungsspezifische Kategori- [10] R. Wang and D. Strong. Beyond accuracy: What data en zu nutzen, kann der Einsatz von globalen System Lay- quality means to data consumers. Journal of ” Management Information Systems, 12:5–33, 1996. outs“ (Szenario-Mustern) Abhilfe schaffen. Auch für die Be- wertung der Qualität im Nachhinein, also im laufenden Pro- zess, muss es sich zeigen ob der hier vorgestellte Ansatz dafür