<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.0 20120330//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink">
  <front>
    <journal-meta />
    <article-meta>
      <title-group>
        <article-title>Clustering-Ansatz zur Erstellung von Lastprofilen zur Vorhersage des Stromverbrauchs</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <string-name>Christian Bock</string-name>
          <email>bock@cs.unid-uesseldorf.de</email>
          <xref ref-type="aff" rid="aff0">0</xref>
          <xref ref-type="aff" rid="aff1">1</xref>
          <xref ref-type="aff" rid="aff2">2</xref>
        </contrib>
        <aff id="aff0">
          <label>0</label>
          <institution>Big Data, Data Mining, Knowledge Discovery</institution>
          ,
          <addr-line>Clustering, Time Series, Smart Metering, Databases</addr-line>
        </aff>
        <aff id="aff1">
          <label>1</label>
          <institution>G.3 [Probability And Statistics]: Time series analysis; H.2.8 [Database Management]: Database Applications- Data mining; H.3.3 [Information Storage And Retrieval]: Information Search and Retrieval- Clustering; H.4 [Information Systems Applications]: Miscellaneous; J.1 [Administrative Data Processing]: Business</institution>
        </aff>
        <aff id="aff2">
          <label>2</label>
          <institution>Heinrich-Heine-Universität BTU EVU Institut für Informatik Beratung GmbH Universitätsstraße 1 Leostraße 31 40225 Düsseldorf</institution>
          ,
          <addr-line>Deutschland 40545 Düsseldorf</addr-line>
          ,
          <country country="DE">Deutschland</country>
        </aff>
      </contrib-group>
      <pub-date>
        <year>2016</year>
      </pub-date>
      <fpage>21</fpage>
      <lpage>26</lpage>
      <abstract>
        <p>In dieser Arbeit stellen wir einen praxisorientierten Ansatz zur Erstellung von Lastprofilen zur Vorhersage des Energieverbrauchs anhand von SmartM-eteringZ-eitreihen vor. Die prinzipielle Idee ist es, historische Verbrauchszeitreihen mittels FuzzyC-lustering in Gruppen zu unterteilen. Diese Einteilung in Gruppen erm¨oglicht es Energiewirtschaftsunternehmen Kunden mit jeweils ¨ahnlichem Verbrauchsverhalten zu identifizieren und darauf basierend den Einkauf von Energiemengen entsprechend zu planen. Die Besonderheit dieses Ansatzes ist es, dass auch energiewirtschaftspezifisches Anwendungswissen bei der Erstellung und Auswertung der gewonnenen Lastprofile beru¨cksichtigt wird; so ist beispielsweise das Konsumverhalten von Endverbrauchern an lokalen Feiertagen unter Umst¨anden g¨anzlich anders als an Werktagen. Der hier vorgestellte Ansatz identifiziert daher nicht nur unterschiedliche Kundengruppen sowie deren typisches Verbrauchsverhalten, sondern unterteilt das Verbrauchsverhalten daru¨ber hinaus auch zeitlich. Die durch diese Unterteilung gewonnenen Lastprofile haben dadurch ein Format, das sich stark an den bei den Stadtwerken eingesetzten Lastprofilen orientiert und eignen sich daher besonders gut fu¨r den Einsatz in deren Gesch¨aftsprozessen oder denen entsprechender Dienstleister.</p>
      </abstract>
    </article-meta>
  </front>
  <body>
    <sec id="sec-1">
      <title>Categories and Subject Descriptors</title>
      <p>1.</p>
    </sec>
    <sec id="sec-2">
      <title>EINLEITUNG</title>
      <p>
        Fu¨r Betreiber von Stadtwerken ist die korrekte
Bilanzierung von Energiedaten von essentieller Wichtigkeit fu¨r die
Stabilit¨at der Energieversorgung. Die Herausforderung von
Stadtwerken besteht dabei in der Notwendigkeit, den
Energieverbrauch ihrer Kunden bereits im Voraus zu kennen
oder zumindest absch¨atzen zu k¨onnen; dies erm¨oglicht es
den Stadtwerken, den Strombedarf fru¨hzeitig bei
Stromerzeugern anzumelden, wodurch diese die erforderlichen
Kapazit¨aten vorhalten k¨onnen, sobald diese ben¨otigt werden.
Die Absch¨atzung des Stromverbrauchs erfolgt dabei
mittels so genannter Lastprofile (siehe Abschnitt 3).
U¨blicherweise setzen Stadtwerke hierbei die Standardlastprofile ein,
welche vom Bundesverband der Energie- und
Wasserwirtschaft (BDEW) bereitgestellt werden. Diese
Standardlastprofile wurden in den 1990er Jahren anhand von Messungen
des damaligen Verbands der Elektrizit¨atswirtschaft (VDEW)
erzeugt. Hieraus ergibt sich jedoch das Problem, dass die
Profile aufgrund mangelnder Anpassung an aktuelle
Entwicklungen zunehmend schlechter als Modell zur Prognose
des Energieverbrauchs geeignet sind [
        <xref ref-type="bibr" rid="ref15">27</xref>
        ]. Durch die
Liberalisierung des Strom- und Gasmarktes und dem dadurch
entstandenen Konkurrenzdruck zwischen den
Energieversorgungsunternehmen, sowie durch den zunehmenden Einsatz
von Technologien wie Smart Metering, wurden
Innovationen, welche eine h¨ohere Effizienz bei gleichzeitig
niedrigerem Risiko erlauben, sowohl erm¨oglicht als auch notwendig
[15]. Im Nachfolgenden stellen wir daher einen Ansatz vor,
welcher FuzzyC-lustering [6] verwendet, um optimale
Lastprofile anhand von Smart-Metering-Zeitreihen zu gewinnen.
2.
      </p>
    </sec>
    <sec id="sec-3">
      <title>VERWANDTE ARBEITEN</title>
      <p>
        Mit dem zunehmenden Umfang, in dem im Verlauf der
letzten Jahrzehnte Daten auch im Bereich der
Energiewirtschaft computergestu¨tzt erhoben, verarbeitet und
ausgewertet werden k¨onnen, haben parallel dazu auch entsprechende
Forschungsarbeiten an Bedeutung gewonnen [
        <xref ref-type="bibr" rid="ref12 ref6">18, 24, 9</xref>
        ]. [
        <xref ref-type="bibr" rid="ref1 ref9">1,
21</xref>
        ] zeigen beispielsweise Methoden zur Verbrauchsprognose
auf. Weitere Anwendungsgebiete beinhalten unter Anderem
Ausreießrerkennung [
        <xref ref-type="bibr" rid="ref17">29</xref>
        ] sowie Marketing und Tarifoptimie
rung [
        <xref ref-type="bibr" rid="ref8">8, 20</xref>
        ]. In vielen F¨allen, in denen dabei Clustering zur
Datenanalyse zum Einsatz kommt, wird dabei auf den
KMeans-Algorithmus [
        <xref ref-type="bibr" rid="ref10 ref13 ref4">4, 11, 16, 25, 22</xref>
        ] oder darauf
aufbauende Verfahren [
        <xref ref-type="bibr" rid="ref7">19</xref>
        ] zuru¨ckgegriffen; zunehmend kommt aber
auch FuzzyC-lustering zur Anwendung [
        <xref ref-type="bibr" rid="ref14 ref17 ref6">29, 18, 26</xref>
        ]. Neue
M¨oglichkeiten der Datenanalyse ergeben sich zudem durch
den stetig steigenden Ausbau des Smart Metering [
        <xref ref-type="bibr" rid="ref3">3, 12</xref>
        ].
      </p>
      <p>In dem in dieser Arbeit vorgestellten Verfahren verwenden
wir einen FuzzyC-lustering -Ansatz [6], um Lastprofile aus
einem Datensatz von Smart-Metering-Zeitreihen zu
extrahieren. Diese wiederum eignen sich als Modell zur Prognose
des Energieverbrauchs. Als Neuerung werden hierbei jedoch
nicht nur Kundengruppen identifiziert, sondern auch
Typtage. Dies erm¨oglicht nicht nur eine praxisbezogenere
Darstellung der Lastprofile, da die Kombination aus
Kundengruppe und Typtag sehr gut von den heutigen IT-Systemen der
Stadtwerke verarbeitbar ist, sondern auch eine realistischere
Modellierung des Verbrauchsverhaltens.</p>
    </sec>
    <sec id="sec-4">
      <title>AUFBAU</title>
      <p>VON</p>
    </sec>
    <sec id="sec-5">
      <title>3. STRUKTURELLER</title>
    </sec>
    <sec id="sec-6">
      <title>LASTPROFILEN</title>
      <p>Die Prognose des Energiebedarfs wird von Stadtwerken
typischerweise anhand von Lastprofilen durchgefu¨hrt: hierzu
werden zun¨achst alle Kalendertage in eine Menge von
Typtagen unterteilt. Ein Typtag im Sinne der Energiewirtschaft
ist hierbei eine Menge von Kalendertagen, an denen sich das
Verbrauchsverhalten der Kunden signifikant von dem
anderer Typtage unterscheidet. Die von der BDEW empfohlene
Einteilung besteht dabei aus 9 Typtagen, n¨amlich jeweils
Werktag, Samstag sowie Sonn- und Feiertag fu¨r drei
festgelegte Jahreszeiten Sommer, Winter und U¨bergangszeit. Diese
Einteilung l¨asst sich leicht als Modell eines typischen
Wochenablaufs nachvollziehen: so entspricht es beispielsweise
dem intuitiven Empfinden, dass ein durchschnittlicher
Haushalt tagsu¨ber an einem Werktag aufgrund von
Berufst¨atigkeit ein grunds¨atzlich anderes Verbrauchsverhalten aufweist
gegenu¨ber einem Wochenendtag.</p>
      <p>Daru¨ber hinaus werden die einzelnen Kunden in
Kundengruppen eingeteilt, beispielsweise Haushalt,
Landwirtschaftsbetriebe allgemein, Wochenendbetrieb und weitere. Jeder
solchen Kundengruppe wird fu¨r jeden Typtag ein
Verbrauchsmuster in Form einer Zeitreihe zugewiesen, welche das fu¨r
die jeweilige Kundengruppe typischste
Verbrauchsverhalten an dem jeweiligen Typtag beschreiben. Als Beispiel
zeigt Abbildung 1 den Lastprofilverlauf des Haushaltsprofils
(H0 ) fu¨r die Sommersaison. Die jeweiligen
Verbrauchsmuster bieten dabei eine zeitliche Aufl¨osung von 15 Minuten
und sind normiert, das heitß sie stellen lediglich den
relativen Energieverbrauch der einzelnen Kunden dar.
Mithilfe des bei den Endverbrauchern im Rahmen der j¨ahrlichen
Stromz¨ahlerablesung erhobenen Jahresverbrauchs, welcher
die Grundlage fu¨r die Jahresverbrauchsprognose (JVP) des
Kunden fu¨r das Folgejahr bildet, und des fu¨r das jeweilige
Profil spezifischen Normierungsfaktors, lassen sich die
Lastprofile fu¨r jeden Kunden individuell skalieren. Somit
erm¨oglicht die Kenntnis der Jahresverbrauchsprognose mithilfe der
Lastprofile fu¨r jeden Verbraucher eine viertelstundenscharfe
Prognose des Energiebedarfs fu¨r das komplette Jahr.</p>
      <p>Aufgrund der Unterteilung der Energieverbr¨auche in
zuvor festgelegte Typtage und Kundengruppen stellen
Lastprofile ein sehr einfaches Prognosemodell dar. Je
zuver</p>
      <p>Werktag</p>
      <p>Samstag</p>
      <p>Sonn- und Feiertag
l¨assiger und pr¨aziser die verwendeten Lastprofile dabei
jedoch den tats¨achlichen Energiebedarf der Kunden
modellieren, desto h¨oher ist die Planungssicherheit der Stadtwerke
beim Einkauf des Stroms von den Kraftwerken. Hierbei wird
nicht vorausgesetzt, dass s¨amtliche einer bestimmten
Kundengruppe zugewiesenen Verbraucher an gleichen Typtagen
stets das gleiche Verbrauchsmuster aufweisen. Dies ist
beispielsweise aufgrund von fu¨r Stadtwerke unvorhersehbaren,
individuellen Urlaubsreisen einzelner Endverbraucher nicht
realisierbar. Stattdessen nimmt man an, dass die der
jeweiligen Kundengruppe zugewiesenen Verbraucher als Ganzes
besagtes Verbrauchsmuster aufweisen. Aufgrund dieser
Eigenschaft eignen sich Clustering-Ans ¨atze, um Lastprofile
basierend auf bekannten Energieverbrauchszeitreihen zu
erzeugen. Im nachfolgenden Abschnitt stellen wir ein solches
Verfahren vor.
4.</p>
    </sec>
    <sec id="sec-7">
      <title>ANSATZ ZUM ERZEUGEN VON LAST</title>
    </sec>
    <sec id="sec-8">
      <title>PROFILEN</title>
      <p>Fu¨r die Zusammenstellung der Lastprofile aus
SmartMeter-Zeitreihen verwenden wir ein dreistufiges Verfahren :
• Im ersten Schritt bestimmen wir die optimale Anzahl
an Typtagen sowie deren Aufteilung auf die einzelnen
Kalendertage
• Im zweiten Schritt bestimmen wir fu¨r jeden Typtag
die optimale Anzahl an Verbrauchsmustern sowie
deren konkrete Auspr¨agungen
• Im dritten Schritt werden die Lastprofile aus den zuvor
ermittelten Daten zusammengestellt und die
Messstellen einem Profil zugewiesen
4.1</p>
    </sec>
    <sec id="sec-9">
      <title>Bestimmung der Typtage</title>
      <p>Zur Bestimmung von Typtagen ist es wichtig zu wissen,
ob und wie stark sich die Energieverbr¨auche pro Tag als
Ganzes voneinander unterscheiden. Diese Betrachtung muss
folgende Eigenschaften aufweisen:
• Sie muss unabh¨angig von der Anzahl der Messstellen
sein
• Sie muss die Form der Verbrauchszeitreihe
beru¨cksichtigen, nicht aber die Menge der Energie
Der erste Punkt ist intuitiv leicht verst¨andlich. Beim zweiten
Punkt hingegen flietß energiewirtschaftsspezifisches Anwe
ndungswissen mit ein: so werden Lastprofile seitens
Stadtwerken ausschlielßich dazu verwendet, um zwischen
verschiedenen Arten von Verbrauchsmustern bei Kunden zu
unterscheiden; eine Skalierung des vom Lastprofil
prognostizierten Tagesverbrauchs erfolgt anhand der
Jahresverbrauchsprognose des jeweiligen Kunden. Diese errechnet sich aus
der j¨ahrlich von den Stadtwerken durchgefu¨hrten Ablesung
des Stromz¨ahlers und wird hier nicht weiter betrachtet.</p>
      <p>Um die oben genannten Punkte bei der Identifikation der
Typtage zu beru¨cksichtigen, konstruieren wir zun¨achst aus
den Smart-Meter-Zeitreihen Si, 1 ≤ i ≤ N aller N Kunden
mit den Messwerten si,j fu¨r die Zeitpunkte tj , 1 ≤ j ≤ T
eine neue Zeitreihe X = { x1, x2, ..., xT } wie folgt:
xj =</p>
      <p>N
1 X</p>
      <p>si,j
N i=1 PjT′=1 si,j′
(1)
Hierbei ist PjT′=1 si,j′ ein zeitreihenspezifischer
Normierungsfaktor. Dieser erm¨oglicht es beim Clustering
ausschlielßich die Form des Verbrauchverhaltens zu
beru¨cksichtigen, wodurch Gering- und Vielverbraucher, deren
Konsumverhalten sich bis auf einen skalaren Faktor sehr ¨ahneln, nach
Abschluss unseres Verfahrens denselben Clustern
zugeordnet wurden. Anschaulich entspricht die Zeitreihe X somit
einer Mittelwertszeitreihe aus allen normierten
Smart-MeterZeitreihen. Durch die Mittelwertsbildung wird eine
Unabh¨angigkeit in Bezug auf die Anzahl der Messstellen erreicht.
Im Anschluss konstruieren wir aus X den Datensatz D mit
den Elementen dl wie folgt:



D = dl = (xj, ..., xj+m)



∀a mit 
1 ≤l-tjet≤an gKaeah≤l¨oerjntd+zeurmtma≤g T :  (2)
(m + 1) entspricht hierbei der Anzahl der gemessenen Werte
pro Tag. In der Praxis h¨aufig anzutreffende Messintervalle
fu¨r Smart-Meter-Zeitreihen sind 1 Messung alle 15, 30 oder
60 Minuten, wodurch die dl jeweils einem 96-, 48-
beziehungsweise 24-Tupel entsprechen. Diesen Datensatz D
segmentieren wir mittels FuzzyC-M-eans [6] mit verschiedenen
Werten fu¨r die Anzahl der Cluster (c); der optimale Wert
fu¨r c und die optimale Clustereinteilung werden
anschlieeßnd durch die Auswertung verschiedener
ClusterV-alidityIndizes [7] bestimmt. Mit dieser Vorgehensweise ist es nicht
nur m¨oglich die optimale Anzahl an Typtagen auf Basis der
Smart-Meter-Zeitreihen zu bestimmen; aufgrund der
Kenntnis, welche dl denselben ClusterZ-entroiden zugeordnet
wurden und welchem Kalendertag sie jeweils entsprechen, ist es
m¨oglich zu bestimmen welche Kalendertage zu einem
Typtag zusammengefasst werden. Ein Analyst begutachtet die
Kategorisierung der Kalendertage, arbeitet
Regelm¨aißgkeiten heraus und u¨bertr¨agt sie auf zuku¨nftige Tage.
4.2</p>
    </sec>
    <sec id="sec-10">
      <title>Bestimmung typischer Verbrauchsmuster</title>
      <p>Um die Anzahl und Auspr¨agungen der
Verbrauchsmuster in Hinblick auf die finalen Kundengruppen
herauszuarbeiten, unterteilen wir die zur Verfu¨gung stehenden
SmartMeter-Messwerte zun ¨achst in disjunkte Mengen P1, ..., PL
ein. Seien hierzu Kn, 1 ≤ n ≤ L die in Abschnitt 4.1
bestimmten Typtage, welche jeweils die zum jeweiligen Typtag
zugeordneten tj enthalten. Dann konstruieren wir Pn, 1 ≤
n ≤ L mit den Elementen pe,n wie folgt:</p>
      <p>∀a, b mit 
1 ≤ j ≤ a, b ≤ j + m ≤ T : </p>
      <p>ta, tb ∈ Kn und  (3)
deymi,sae,lybie,bngKeha¨olernednezrutag 
mit yi,j =</p>
      <p>si,j</p>
      <p>PjT′=1 si,j′
Anschaulich entspricht Pn ¨ahnlich wie D in Abschnitt 4.1
einem Datensatz, bei dem Messwerte eines Kalendertages
zu jeweils einem (m + 1)-Tupel zusammengefasst wurden.
Anders als D basiert Pn jedoch auf den normierten
Messwerten yi,j und enth¨alt nur die Daten der Kalendertage,
die dem Typtag Kn zugeordnet wurden. Jeden der
Datens¨atze Pn segmentieren wir anschlieeßnd unter Verwendung
von FuzzyC-M-eans . Analog zur Bestimmung der Typtage
segmentieren wir auch in diesem Fall die Pn mit
verschiedenen Werten fu¨r die Anzahl der Cluster c und
bestimmen die optimale Clustereinteilung mithilfe von
ClusterValidityI-ndizes ; die daraus resultierenden fu¨r den
jeweiligen Pn-Datensatz als optimal bewerteten ClusterZ-entroiden
Cq,n, 1 ≤ q ≤ cn,optimal entsprechen den gesuchten
typischsten Verbrauchsmustern fu¨r den Typtag Kn.
4.3</p>
    </sec>
    <sec id="sec-11">
      <title>Bestimmung der Lastprofile</title>
      <p>Lastprofile im Sinne von Abschnitt 3 kann man als eine
Menge von L-Tupeln darstellen, bei denen der n-te Eintrag
eines solchen Tupels dem Verbrauchsmuster an zum
Typtag Kn geh¨origen Kalendertagen beschreibt. Jedem Kunden
wird anschlieeßnd ein solches Lastprofil zugewiesen. Das Er
zeugen der Menge von Lastprofilen G ist somit prinzipiell
durch Bildung des kartesischen Produktes aus den in
Abschnitt 4.2 gewonnenen Verbrauchsmustern Cq,n, gruppiert
anhand der in Abschnitt 4.1 ermittelten Typtage Kn,
m¨oglich:
mit Wn = { Cq,n | 1 ≤ q ≤ cn,optimal }
(4)
G =</p>
      <p>L
Y Wn
n=1
Bei dieser Vorgehensweise fehlen allerdings noch die zur
praktischen Verwendung der Profile notwendigen
Profilzuordnungen Z; diese beschreiben, welcher Kunde welchem
Lastprofil zugewiesen wurde, und somit welche
Verbrauchsmuster als Grundlage fu¨r die Bilanzierung des zu
erwartenden Energieverbrauchs dieses Kunden dienen. Daru¨ber
hinaus ist nicht garantiert, dass jedes durch das kartesische
Produkt gebildete Lastprofil einen Kunden zugewiesen
bekommt. Aus diesem Grund schlagen wir vor, fu¨r jeden
Kunden ein individuelles Profil zu berechnen; dabei sagen wir,
dass ein Kunde, hier repr¨asentiert durch die entsprechende
Smart-Meter-Zeitreihe Si, am Typtag Kn dem
Verbrauchsmuster Cq,n zugewiesen wurde, wenn die auf Si
basierenden Tupel im Datensatz Pn beim Clustering am
h¨aufigsten den h¨ochsten Zugeh¨origkeitsgrad zum Verbrauchsmuster
Cq,n aufweisen.</p>
      <p>Algorithmus 1 beschreibt diese Vorgehensweise in
Pseudocode. Die Hilfsvariable H stellt hierbei ein Lastprofil in
Algorithmus 1 Bestimmung der Lastprofile
Eingabe: Si, Pn, Kn, Cq,n, Un
Ausgabe: Menge aller Lastprofile G, Menge der
Profilzuordnungen Z
1: G ← ∅
2: Z ← ∅
3: for i = 1 to N do
4: for n = 1 to L do
5: H [n] ← Cq,n mit
∃j : (yi,j, ..., yi,j+m) = pe,n</p>
      <p>∧ ∄q′′ : uq′′,e,n &gt; uq′,e,n
q = arg maxq′</p>
      <p>pe,n
6: end for
7: G ← G ∪ H
8: Z ← Z ∪ (Si, H)
9: end for
10: return G, Z
Form eines L-dimensionalen Arrays dar, bei dem H [n] dem
Verbrauchsmuster am Typtag Kn entspricht. Die
Profilzuordnungen Z werden durch eine Menge von 2-Tupeln
beschrieben, wobei der jeweils erste Eintrag den Kunden
beziehungsweise seine Smart-Meter-Zeitreihe Si und der zweite
Eintrag das ihm zugewiesene Lastprofil enth¨alt. Die in
Algorithmus 1 verwendeten uq,e,n ∈ Un entsprechen den in
Abschnitt 4.2 mittels FuzzyC-M-eans bestimmten
Zugeh¨origkeitsgraden des Datensatz-Tupels pe,n zum
Verbrauchsmuster Cq,n.</p>
    </sec>
    <sec id="sec-12">
      <title>EXPERIMENTELLE UNTERSUCHUNG</title>
    </sec>
    <sec id="sec-13">
      <title>Beschreibung des Datensatzes</title>
      <p>Zur Evaluation des in Abschnitt 4 vorgestellten
Verfahrens steht uns ein realer Smart-Meter-Datensatz zur
Verfu¨gung. Die darin enthaltenen Zeitreihen entsprechen den
im Bilanzierungsgebiet eines Stadtwerks registrierten
Kunden, darunter beispielsweise Haushaltskunden,
Gewerbekunden und Landwirtschaftsbetriebe. In unserem konkreten Fall
entspricht dies 7668 Messstellen, jeweils mit Daten fu¨r einen
Zeitraum vom 26 Monaten, bei einer zeitlichen Aufl¨osung
von 1 Messung pro Stunde. Aufgrund der Tatsache, dass es
sich hierbei um ein Gebiet mit einem vollst¨andigen Rollout
von Smart-Meter-Z ¨ahlern handelt, wird es uns hierdurch
erm¨oglicht, das vorgestellte Verfahren unter realistischen
Bedingungen zu bewerten. Bei der Verarbeitung der Daten
wurden ausschlielßich die Zeitreihenmesswerte ber
u¨cksichtigt; Informationen u¨ber gegebenenfalls aktuell den
Messstellen zugeordneten Kundengruppen blieb aueßr Acht.
5.2</p>
    </sec>
    <sec id="sec-14">
      <title>Auswertung</title>
      <p>Um die optimale Einteilung in Typtage zu
bestimmen, wurden die zur Verfu¨gung stehenden
Smart-MeterZeitreihen gem¨aß Formel 2 zu einem 24-dimensionalen
Datensatz aufbereitet und anschlieeßnd mittels FuzzyC-M-eans
mit verschiedenen Werten fu¨r c geclustert (2 ≤ c ≤ 25). Als
Distanzfunktion wurde die euklidische Distanz verwendet.
Um verf¨alschten Ergebnissen aufgrund der Initialisierung
der Cluster mit Zufallskoordinaten vorzubeugen, wurde fu¨r
jeden Wert fu¨r c das entsprechende Clustering-Experiment
100-mal unabh ¨angig voneinander wiederholt und jeweils mit
ClusterV-alidityI-ndizes (CVI) bewertet.</p>
      <p>
        Tabelle 1 zeigt eine U¨bersicht der Bewertung der
Clustereinteilungen anhand verschiedener, in der Literatur weit
verbreiteter, Cluster-Validity-Indizes. Die einzelnen Z ellen
der Tabelle enthalten hierbei die H¨aufigkeit, wie oft von den
100 Iterationen der jeweilige Wert fu¨r c vom
entsprechenden CVI als der beste bewertet wurde. Auf den ersten Blick
ist hierbei erkennbar, dass die CVIs VP C [5], VNP C [
        <xref ref-type="bibr" rid="ref11 ref2">2, 23</xref>
        ]
und VXIE [
        <xref ref-type="bibr" rid="ref16">28</xref>
        ] eine kleine Anzahl an Clustern (c ≤ 5)
deutlich bevorzugen. Dem gegenu¨ber stehen die CVIs VF H , VP D
und VAP D [13]; diese bewerten groeß Werte f u¨r die Anzahl
an Clustern (c ≥ 5) als sehr gut, darunter insbesondere den
Bereich 5 ≤ c ≤ 10, jedoch mit einer auffallend negativen
Bewertung des Wertes c = 6. Einzig der Index VBW S
bewertet den Bereich 5 ≤ c ≤ 7 durchgehend positiv.
      </p>
      <p>
        Die Tendenz der CVIs VP C, VNP C und VXIE zu einer
eher geringen Anzahl an Clustern ist hierbei wenig
u¨berraschend. Im Falle von VXIE belegen zahlreiche
Untersuchungen die monoton abfallenden Werte des Bewertungsmaeßs
fu¨r steigende c [
        <xref ref-type="bibr" rid="ref5">17</xref>
        ]; VP C beziehungsweise VNP C liefern nur
bei klar getrennten, sph¨arischen Clustern gute Ergebnisse
und untersch¨atzen in sonstigen F¨allen den besten Wert fu¨r
c sehr h¨aufig [
        <xref ref-type="bibr" rid="ref5">7, 17</xref>
        ]. Die CVIs VF H , VP D und VAP D
hingegen weisen eine zu groeß Streuung der Ergebnisse auf, als
dass diese fu¨r eine aussagekr¨aftige Schlussfolgerung
herangezogen werden k¨onnen. VBW S konnte sich in
experimentellen Untersuchungen sowohl bei synthetischen als auch realen
Datens¨atzen als hervorragendes Bewertungsmaß profilieren
[
        <xref ref-type="bibr" rid="ref5">7, 17</xref>
        ]. In unseren Experimenten hat VBW S die
Clustereinteilungen im Bereich 5 ≤ c ≤ 7 als sehr gut eingestuft; fu¨r
weiterfu¨hrende Experimente zur Bestimmung typischer
Verbrauchsmuster und Erzeugung der Lastprofile erachten wir
daher die Zugrundelegung der Typtagunterteilungen mit 5
bis 7 Typtagen fu¨r sinnvoll.
6.
      </p>
    </sec>
    <sec id="sec-15">
      <title>AUSBLICK</title>
      <p>In dieser Arbeit haben wir einen Ansatz zur
Generierung von Lastprofilen aus Smart-Meter-Zeitreihen
vorgestellt. Aufgrund der Tatsache, dass wir bei diesem
Verfahren weder die Anzahl der Typtage, die Anzahl der
Kundengruppen, noch deren konkrete Auspr¨agungen fest
vorgeben, bilden die finalen Lastprofile das Verbrauchsverhalten
der Kunden optimal ab. Durch Herausarbeiten von
Regelm¨aißgkeiten in dem Auftreten der ermittelten Typtage und
deren U¨bertragung auf zuku¨nftige Tage wird es den
Stadtwerken somit erm¨oglicht, das zuku¨nftige Konsumverhalten
von Verbrauchern zu prognostizieren und so die Menge der
einzukaufenden Energie besser an den tats¨achlichen Bedarf
anzupassen.</p>
      <p>Die weiterfu¨hrende experimentelle Untersuchung unseres
Verfahrens hinsichtlich der Identifizierung von
Verbrauchsmustern, der Erzeugung der Lastprofile, deren Vergleich zu
den BDEW-Standardlastprofilen und den Einfluss von
Ausreießrn auf die Qualit ¨at der Ergebnisse steht derzeit noch
aus; diese werden wir in zuku¨nftigen Ver¨offentlichungen
publizieren.</p>
      <p>In dieser Arbeit haben wir zur Bestimmung der Typtage
und Verbrauchsmuster FuzzyC-M-eans verwendet.
Prinzipiell w¨aren hierfu¨r auch andere zentroidbasierte,
partitionierende Clustering-Verfahren wie GustafsonK-essel [14] oder
Fuzzy Maximum Likelihood Estimation (FMLE) [13]
denkbar. W¨ahrend bei der Bestimmung der Typtage auch
dichtebasierte Clustering-Verfahren wie DBSCAN [10] zum
Einsatz kommen k¨onnen, ist dies bei der Erkennung der
Verbrauchsmuster nach unserem Ansatz nicht m¨oglich, da die
bei dichtebasierten Clustering-Verfahren fehlenden Zent
roiden die typischsten Verbrauchsmuster darstellen, welche
gem¨aß Algorithmus 1 Teil der Lastprofile sind. In weiterf
u¨hrenden Arbeiten planen wir auch den Vergleich der Qualit¨at der
durch die Verwendung verschiedener zentroidbasierten,
partitionierenden Clustering-Verfahren gewonnenen Lastpro
file.</p>
      <p>Bei den von uns durchgefu¨hrten Experimenten konnten
die Typtage von einem handelsu¨blichen Desktop-Computer
(Intel Core i7-4790 @ 3,6 GHz) innerhalb von 30 Minuten
gefunden werden. Da jedoch unser Verfahren die Lastprofile,
insbesondere die Verbrauchsmuster, anhand der Messwerte
aller Smart-Meter-Zeitreihen zusammenstellt ist zu erwar
ten, dass die ben¨otigte Rechenzeit durch zuku¨nftig
gemessene Smart-Meter-Daten bei einer Neuerstellung der
Lastprofile signifikant zunimmt. Dies betrifft speziell Stadtwerke
mit vielen Kunden. Ein m¨oglicher Ansatz fu¨r
weiterfu¨hrende Arbeiten bestu¨nde daher darin zu bestimmen, welchen
Zeitraum die Smart-Meter-Daten f u¨r eine sinnvolle
Erstellung der Lastprofile mindestens abdecken mu¨ssen. W¨are dies
bekannt, k¨onnten Stadtwerke ihre Datenbest¨ande
entsprechend filtern, sodass nur die aktuellsten fu¨r das Clustering
notwendigen Messwerte herangezogen werden; dies wu¨rde
den Rechenaufwand auch fu¨r groeß Stadtwerke in einem
angemessenen Rahmen halten. Eine alternative
Vorgehensweise w¨are es, neu hinzukommende Smart-Meter-Messwerte
inkrementell in existierende Lastprofile zu integrieren und die
Qualit¨at der auf diese Weise erzeugten Profile mit denen
einer Neuberechnung zu vergleichen.</p>
    </sec>
    <sec id="sec-16">
      <title>ACKNOWLEDGEMENT</title>
      <p>Diese Arbeit entstand mit freundlicher Unterstu¨tzung der
BTU EVU Beratung GmbH.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <ref id="ref1">
        <mixed-citation>
          [1]
          <string-name>
            <given-names>F.</given-names>
            <surname>Andersen</surname>
          </string-name>
          ,
          <string-name>
            <given-names>H.</given-names>
            <surname>Larsen</surname>
          </string-name>
          , and
          <string-name>
            <given-names>T.</given-names>
            <surname>Boomsma</surname>
          </string-name>
          .
          <article-title>Long-term forecasting of hourly electricity load: Identification of consumption profiles and segmentation of customers</article-title>
          .
          <source>Energy Conversion and Management</source>
          ,
          <volume>68</volume>
          :
          <fpage>244</fpage>
          -
          <lpage>252</lpage>
          ,
          <year>2013</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref2">
        <mixed-citation>
          [2]
          <string-name>
            <given-names>E.</given-names>
            <surname>Backer</surname>
          </string-name>
          .
          <article-title>Cluster analysis by optimal decomposition of induced fuzzy sets</article-title>
          .
          <source>PhD thesis</source>
          , TU Delft, Delft University of Technology,
          <year>1978</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref3">
        <mixed-citation>
          [3]
          <string-name>
            <given-names>C.</given-names>
            <surname>Beckel</surname>
          </string-name>
          ,
          <string-name>
            <given-names>L.</given-names>
            <surname>Sadamori</surname>
          </string-name>
          ,
          <string-name>
            <given-names>T.</given-names>
            <surname>Staake</surname>
          </string-name>
          , and
          <string-name>
            <given-names>S.</given-names>
            <surname>Santini</surname>
          </string-name>
          .
          <article-title>Revealing household characteristics from smart meter data</article-title>
          .
          <source>Energy</source>
          ,
          <volume>78</volume>
          :
          <fpage>397</fpage>
          -
          <lpage>410</lpage>
          ,
          <year>2014</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref4">
        <mixed-citation>
          [16]
          <string-name>
            <given-names>L.</given-names>
            <surname>Hernan</surname>
          </string-name>
          ´dez, C. Baladorn´,
          <string-name>
            <given-names>J. M.</given-names>
            <surname>Aguiar</surname>
          </string-name>
          ,
          <string-name>
            <given-names>B.</given-names>
            <surname>Carro</surname>
          </string-name>
          ,
          <article-title>and</article-title>
          <string-name>
            <surname>A</surname>
          </string-name>
          . San´chez-Esguevillas.
          <article-title>Classification and clustering of electricity demand patterns in industrial parks</article-title>
          .
          <source>Energies</source>
          ,
          <volume>5</volume>
          (
          <issue>12</issue>
          ):
          <fpage>5215</fpage>
          ,
          <year>2012</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref5">
        <mixed-citation>
          [17]
          <string-name>
            <given-names>L.</given-names>
            <surname>Himmelspach</surname>
          </string-name>
          .
          <article-title>Fuzzy Clustering of Incomplete Data</article-title>
          .
          <source>PhD thesis</source>
          , Heinrich-Heine-Universit ¨at Du¨sseldorf,
          <year>2016</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref6">
        <mixed-citation>
          [18]
          <string-name>
            <surname>K. le Zhou</surname>
            ,
            <given-names>S.</given-names>
          </string-name>
          lin
          <string-name>
            <surname>Yang</surname>
            , and
            <given-names>C.</given-names>
          </string-name>
          <string-name>
            <surname>Shen</surname>
          </string-name>
          .
          <article-title>A review of electric load classification in smart grid environment</article-title>
          .
          <source>Renewable and Sustainable Energy Reviews</source>
          ,
          <volume>24</volume>
          :
          <fpage>103</fpage>
          -
          <lpage>110</lpage>
          ,
          <year>2013</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref7">
        <mixed-citation>
          [19]
          <string-name>
            <given-names>J. J.</given-names>
            <surname>Lop</surname>
          </string-name>
          <article-title>´ez</article-title>
          ,
          <string-name>
            <given-names>J. A.</given-names>
            <surname>Aguado</surname>
          </string-name>
          ,
          <string-name>
            <given-names>F.</given-names>
            <surname>Marıtn´</surname>
          </string-name>
          ,
          <string-name>
            <surname>F.</surname>
          </string-name>
          <article-title>Mun˜oz, A. Rodırg´uez, and</article-title>
          <string-name>
            <given-names>J. E.</given-names>
            <surname>Ruiz</surname>
          </string-name>
          . Hopfieldk-
          <article-title>-means clustering algorithm: A proposal for the segmentation of electricity customers</article-title>
          .
          <source>Electric Power Systems Research</source>
          ,
          <volume>81</volume>
          (
          <issue>2</issue>
          ):
          <fpage>716</fpage>
          -
          <lpage>724</lpage>
          ,
          <year>2011</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref8">
        <mixed-citation>
          [20]
          <string-name>
            <given-names>N.</given-names>
            <surname>Mahmoudi-Kohan</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M. P.</given-names>
            <surname>Moghaddam</surname>
          </string-name>
          , and
          <string-name>
            <given-names>M.</given-names>
            <surname>Sheikh-El-Eslami</surname>
          </string-name>
          .
          <article-title>An annual framework for clustering-based pricing for an electricity retailer</article-title>
          .
          <source>Electric Power Systems Research</source>
          ,
          <volume>80</volume>
          (
          <issue>9</issue>
          ):
          <fpage>1042</fpage>
          -
          <lpage>1048</lpage>
          ,
          <year>2010</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref9">
        <mixed-citation>
          [21]
          <string-name>
            <given-names>M.</given-names>
            <surname>Misiti</surname>
          </string-name>
          ,
          <string-name>
            <given-names>Y.</given-names>
            <surname>Misiti</surname>
          </string-name>
          , G. Oppenheim,
          <string-name>
            <surname>J.-M. Poggi</surname>
          </string-name>
          , et al.
          <article-title>Optimized clusters for disaggregated electricity load forecasting</article-title>
          .
          <source>Revstat</source>
          ,
          <volume>8</volume>
          (
          <issue>2</issue>
          ):
          <fpage>1051</fpage>
          -
          <lpage>24</lpage>
          ,
          <year>2010</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref10">
        <mixed-citation>
          [22]
          <string-name>
            <given-names>F.</given-names>
            <surname>Rodrigues</surname>
          </string-name>
          ,
          <string-name>
            <given-names>J.</given-names>
            <surname>Duarte</surname>
          </string-name>
          ,
          <string-name>
            <given-names>V.</given-names>
            <surname>Figueiredo</surname>
          </string-name>
          ,
          <string-name>
            <given-names>Z.</given-names>
            <surname>Vale</surname>
          </string-name>
          , and
          <string-name>
            <given-names>M.</given-names>
            <surname>Cordeiro</surname>
          </string-name>
          .
          <source>Machine Learning and Data Mining in Pattern Recognition: Third International Conference</source>
          , MLDM 2003 Leipzig, Germany, July 57-,
          <source>2003 Proceedings, chapter A Comparative Analysis of Clustering Algorithms</source>
          Applied to Load Profiling, pages
          <fpage>738</fpage>
          -
          <lpage>5</lpage>
          . Springer Berlin Heidelberg, Berlin, Heidelberg,
          <year>2003</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref11">
        <mixed-citation>
          [23]
          <string-name>
            <given-names>M.</given-names>
            <surname>Roubens</surname>
          </string-name>
          .
          <article-title>Pattern classification problems and fuzzy sets</article-title>
          .
          <source>Fuzzy Sets and Systems</source>
          ,
          <volume>1</volume>
          (
          <issue>4</issue>
          ):
          <fpage>239</fpage>
          -
          <lpage>253</lpage>
          ,
          <year>1978</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref12">
        <mixed-citation>
          [24]
          <string-name>
            <given-names>C.</given-names>
            <surname>Rudin</surname>
          </string-name>
          ,
          <string-name>
            <given-names>D.</given-names>
            <surname>Waltz</surname>
          </string-name>
          ,
          <string-name>
            <given-names>R. N.</given-names>
            <surname>Anderson</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Boulanger</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Salleb-Aouissi</surname>
          </string-name>
          ,
          <string-name>
            <given-names>M.</given-names>
            <surname>Chow</surname>
          </string-name>
          ,
          <string-name>
            <given-names>H.</given-names>
            <surname>Dutta</surname>
          </string-name>
          ,
          <string-name>
            <given-names>P. N.</given-names>
            <surname>Gross</surname>
          </string-name>
          ,
          <string-name>
            <given-names>B.</given-names>
            <surname>Huang</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S.</given-names>
            <surname>Ierome</surname>
          </string-name>
          ,
          <string-name>
            <given-names>D. F.</given-names>
            <surname>Isaac</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Kressner</surname>
          </string-name>
          ,
          <string-name>
            <given-names>R. J.</given-names>
            <surname>Passonneau</surname>
          </string-name>
          ,
          <string-name>
            <given-names>A.</given-names>
            <surname>Radeva</surname>
          </string-name>
          , and
          <string-name>
            <surname>L. Wu.</surname>
          </string-name>
          <article-title>Machine learning for the new york city power grid</article-title>
          .
          <source>IEEE Transactions on Pattern Analysis and Machine Intelligence</source>
          ,
          <volume>34</volume>
          (
          <issue>2</issue>
          ):
          <fpage>3283</fpage>
          -
          <lpage>45</lpage>
          ,
          <year>Feb 2012</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref13">
        <mixed-citation>
          [25]
          <string-name>
            <surname>T. R</surname>
          </string-name>
          ¨as¨anen, D. Voukantsis,
          <string-name>
            <given-names>H.</given-names>
            <surname>Niska</surname>
          </string-name>
          ,
          <string-name>
            <given-names>K.</given-names>
            <surname>Karatzas</surname>
          </string-name>
          , and
          <string-name>
            <given-names>M.</given-names>
            <surname>Kolehmainen</surname>
          </string-name>
          .
          <article-title>Data-based method for creating electricity use load profiles using large amount of customer-specific hourly measured electricity use data</article-title>
          .
          <source>Applied Energy</source>
          ,
          <volume>87</volume>
          (
          <issue>11</issue>
          ):
          <fpage>3538</fpage>
          -
          <lpage>3545</lpage>
          ,
          <year>2010</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref14">
        <mixed-citation>
          [26]
          <string-name>
            <given-names>J. P. L.</given-names>
            <surname>Viegas</surname>
          </string-name>
          ,
          <string-name>
            <given-names>S. M.</given-names>
            <surname>Vieira</surname>
          </string-name>
          , and
          <string-name>
            <surname>J. M. C.</surname>
          </string-name>
          <article-title>Sousa. Fuzzy clustering and prediction of electricity demand based on household characteristics</article-title>
          . In J. M.
          <string-name>
            <surname>Alonso</surname>
            ,
            <given-names>H.</given-names>
          </string-name>
          <string-name>
            <surname>Bustince</surname>
          </string-name>
          , and M. Reformat, editors,
          <source>2015 Conference of the International Fuzzy Systems Association and the European Society for Fuzzy Logic and Technology (IFSAE-USFLAT1-5)</source>
          , Giojn´, Spain., June 30,
          <year>2015</year>
          . Atlantis Press,
          <year>2015</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref15">
        <mixed-citation>
          [27]
          <string-name>
            <surname>D</surname>
          </string-name>
          .
          <article-title>-I. S. von</article-title>
          <string-name>
            <surname>Roon</surname>
            ,
            <given-names>D.-I. T.</given-names>
          </string-name>
          <string-name>
            <surname>Gobmaier</surname>
            ,
            <given-names>K.</given-names>
          </string-name>
          <string-name>
            <surname>Wachinger</surname>
            , and
            <given-names>M.</given-names>
          </string-name>
          <string-name>
            <surname>Hinterstocker</surname>
          </string-name>
          .
          <article-title>Statusbericht zum Standardlastprofilverfahren Gas</article-title>
          . https://www. ffegmbh.de/kompetenzen/system-markt-analysen/ 508-statusbericht-standardlastprofile-gas ,
          <year>11 2014</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref16">
        <mixed-citation>
          [28]
          <string-name>
            <given-names>X. L.</given-names>
            <surname>Xie</surname>
          </string-name>
          and
          <string-name>
            <given-names>G.</given-names>
            <surname>Beni</surname>
          </string-name>
          .
          <article-title>A validity measure for fuzzy clustering</article-title>
          .
          <source>IEEE Trans. Pattern Anal. Mach</source>
          . Intell.,
          <volume>13</volume>
          (
          <issue>8</issue>
          ):
          <fpage>8418</fpage>
          -
          <lpage>47</lpage>
          , Aug.
          <year>1991</year>
          .
        </mixed-citation>
      </ref>
      <ref id="ref17">
        <mixed-citation>
          [29]
          <string-name>
            <given-names>X.</given-names>
            <surname>Zhang</surname>
          </string-name>
          and
          <string-name>
            <given-names>C.</given-names>
            <surname>Sun</surname>
          </string-name>
          .
          <article-title>Dynamic intelligent cleaning model of dirty electric load data</article-title>
          .
          <source>Energy Conversion and Management</source>
          ,
          <volume>49</volume>
          (
          <issue>4</issue>
          ):
          <fpage>564</fpage>
          -
          <lpage>569</lpage>
          ,
          <year>2008</year>
          .
        </mixed-citation>
      </ref>
    </ref-list>
  </back>
</article>