Ähnlichkeitssuche und Datenexploration über Entitäts-Ranglisten [Abstract] Sebastian Michel TU Kaiserslautern Kaiserslautern, Germany smichel@cs.uni-kl.de ABSTRACT Tabellen oder geordnete Listen sind generische und weit ver- breitete Mittel, um Informationen über Entitäten in einer prägnanten und strukturierten Form darzustellen. Ranglis- ten, die etwa die höchsten Gebäude der Welt, die reichsten Personen Deutschlands oder die leistungsstärksten Autos enthalten, sind allgegenwärtige Beispiele. Mit der Verfügbar- keit großer Mengen solcher Ranglisten, die Entitäten kate- gorisiert nach speziellen Eigenschaften und geordnet anhand unterschiedlichster Metriken in Relation zueinander setzen, können interessante Erkenntnisse hergeleitet werden, indem berechnet wird, welche Ranglisten ähnliche Entitäten ähn- lich ordnen, wobei Rangkriterium und Eigenschaften der En- titäten (stark) unterschiedlich sein können. Dieser Berech- nung liegt das Problem der Ähnlichkeitssuche zugrunde, für das wir zwei verschiedene – auf die spezielle Ähnlichkeits- funktion zugeschnittene – Ansätze entwickelt haben. Des- weiteren betrachten wir das Problem der Erkennung von At- tributen zur sinnvollen Kategorisierung von Mengen von En- titäten und präsentieren ein Verfahren, das vollautomatisch entscheiden kann, ob ein Attribut geeignet oder ungeeignet ist, Entitäten zu kategorisieren. Darüber hinaus geben wir einen Überblick über PALEO und COMPETE, zwei Ansät- ze zur Ranglisten-basierten Datenexploration. 31st GI-Workshop on Foundations of Databases (Grundlagen von Daten- banken), 11.06.2019 - 14.06.2019, Saarburg, Germany. Copyright is held by the author/owner(s).