=Paper= {{Paper |id=Vol-2367/invited_1 |storemode=property |title=None |pdfUrl=https://ceur-ws.org/Vol-2367/invited_1.pdf |volume=Vol-2367 |dblpUrl=https://dblp.org/rec/conf/gvd/Michel19 }} ==None== https://ceur-ws.org/Vol-2367/invited_1.pdf
               Ähnlichkeitssuche und Datenexploration über
                            Entitäts-Ranglisten
                                                              [Abstract]
                                                         Sebastian Michel
                                                         TU Kaiserslautern
                                                      Kaiserslautern, Germany
                                                      smichel@cs.uni-kl.de

ABSTRACT
Tabellen oder geordnete Listen sind generische und weit ver-
breitete Mittel, um Informationen über Entitäten in einer
prägnanten und strukturierten Form darzustellen. Ranglis-
ten, die etwa die höchsten Gebäude der Welt, die reichsten
Personen Deutschlands oder die leistungsstärksten Autos
enthalten, sind allgegenwärtige Beispiele. Mit der Verfügbar-
keit großer Mengen solcher Ranglisten, die Entitäten kate-
gorisiert nach speziellen Eigenschaften und geordnet anhand
unterschiedlichster Metriken in Relation zueinander setzen,
können interessante Erkenntnisse hergeleitet werden, indem
berechnet wird, welche Ranglisten ähnliche Entitäten ähn-
lich ordnen, wobei Rangkriterium und Eigenschaften der En-
titäten (stark) unterschiedlich sein können. Dieser Berech-
nung liegt das Problem der Ähnlichkeitssuche zugrunde, für
das wir zwei verschiedene – auf die spezielle Ähnlichkeits-
funktion zugeschnittene – Ansätze entwickelt haben. Des-
weiteren betrachten wir das Problem der Erkennung von At-
tributen zur sinnvollen Kategorisierung von Mengen von En-
titäten und präsentieren ein Verfahren, das vollautomatisch
entscheiden kann, ob ein Attribut geeignet oder ungeeignet
ist, Entitäten zu kategorisieren. Darüber hinaus geben wir
einen Überblick über PALEO und COMPETE, zwei Ansät-
ze zur Ranglisten-basierten Datenexploration.




31st GI-Workshop on Foundations of Databases (Grundlagen von Daten-
banken), 11.06.2019 - 14.06.2019, Saarburg, Germany.
Copyright is held by the author/owner(s).