SlideShare une entreprise Scribd logo
1  sur  63
Télécharger pour lire hors ligne
1/23
Disputation
Untersuchungen zur räumlichen
Analyse und Visualisierung von
Mietpreisdaten für Immobilienportale
Harald Schernthanner/Geoinformatik/UP
2/23
Inhalt
1. Forschungsrahmen
2. Status Quo
3. Methoden
4. Quantitative Datenbasis
5. (Teil-)Implementierungen
6. Ergebnisse
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
3/23
Quelle: Trulia
1. 1900 US$ Miete in ganz Manhatten?
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
Quelle: Trulia
4/23
1. Zehlendorf 9,27 €/m²|Potsdams Innenstadt 8-10 €/m²?
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
Quelle: Wirtschaftswoche
Quelle: Immoblienscout 24
Quelle: Immonet
5/23
1. Forschungsprobleme
1.Erhebliche Mängel in der räumlichen
Analyse von Immobilienpreisen bei
Immobilienportalen
2.Erhebliche Mängel in der Geovisualisierung
von Mietpreisen bei Immobilienportalen
Ziel der Arbeit: Optimierung räumlicher
Analysemethoden und Methoden der
Geovisualisierung bei Immobilienportalen
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
6/23
1. Forschungsfragen
2. Welche Methoden aus geoinformatischen
Methodenspektrum können anhand realweltlicher
Anforderungen von Portalen adaptiert werden?
3. Wie können die Methoden für eine
Nutzung für Immobilienportale adaptiert werden?
1. Status Quo raumanalytischer und
geovisueller Methoden in Portalen?
?
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
7/23
1. Forschungsrahmen Hypothese
1.Verfahren der räumlichen Statistik und des maschinellen
Lernens zur Mietpreisschätzung sind den bisher
eingesetzten Verfahren der hedonischen Regression
überlegen und eignen sich zur räumlichen Optimierung
von Immobilienportalen
2.Alternative webbasierte Darstellungsformen, wie z.B.
Gridmaps, sind dem Status Quo der Immobilienpreiskarten
von Immobilienportalen überlegen und visualisieren die
tatsächlichen räumliche Verhältnisse von
Immobilienpreisen zweckmäßiger
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
8/23
1. Operationalisierung Teilschritte
Qualitative Analysen:
 Technologische Analyse von 32 Immobilienportale
 Experteninterviews mit 5 Fachexperten
Quantitative Analysen:
 Konzeptionelle Vorüberlegungen zu Verfahren der
Raumanalyse und Geovisualisierung
 Teilimplementierung der Verfahren
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
9/23
2. Status Quo Prozesskette von Immoblienportalen
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
Quelle: Immonet
Research ??

Mittelwert / Median

Hedonische Regression
10/23
2. Status Quo Hedonische Regression
 Funktioneller Zusammenhang zwischen zwischen
Immobilienpreis p und und Immobilieneigenschaften x
 Preis wird über intrinsischen Werte einer Immobilie und deren
Verfügbarkeit berechnet
 Geographische Lage wird außer acht gelassen:
"Everything is related to everything else, but
near things are more related than distant
things."
Tobler, W. R. (1970). A computer movie simulating urban growth in the Detroit region. Economic geography, 234-240.
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
11/23
3. Methoden: Evaluiert im Rahmen der Promotion
 Es erfolgte eine umfassende Verfahrensidentifizierung und
Methodenevaluierung
Vorverarbeitung Maschinelles
Lernen
Räumliche
Schätzverfahren
Geovisualisierung
Autokorrelationstests:
Morans I/ Gearys C/
Getis-Ord Gi
Random Forest Trees Geographisch
gewichtete
Regression
Grid Maps
Hauptkomponenten-
analyse
Künstliche Neuronale
Netze
Ordinary
Kriginging
Webkarten mit Map
APIs und Java Script
Kartenbibliotheken
Random Forest Trees Kriging with
external drift
Cloudbasierte
Geovisualisierungen
Ordinary Cokriging
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
12/23
4. Quantitative Datenbasis
 Einmalige „Big Data“ Datenquelle in der sonst von
Intransparenz gekennzeichneten
Immobilienwirtschaft
 Alle auf Immobilienscout 24 gelisteten Mietangebote
der Stadt Potsdam vom ersten Quartal 2004 bis zum
September 2013: 80% Marktabdeckung
 Multivariater Datensatz: 74.098 geokodierte
Angebote mit 64 immobilienspezifischen Variablen.
 Angebotsdichte von 40 - 900 Angeboten je Stadtteil
und Jahr
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
13/23
5.1 (Teil-)Implementierung Ordinary Kriging
 Kriging = räumliche-
geostatistische
Interpolationsmethode,
 Kaum Anwendungen des
Verfahrens auf die
Mietpreisschätzung
 Räumlicher
Zusammenhang über die
Abstandsvektoren und
Nachbarschaft der
Angebotspunkte
Potsdam
1319 Angebote
1. Quartal 2013
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
14/23
5.1 (Teil-)Implementierung Ordinary Kriging
 3 Kriging Verfahren und 3 Parameter in 120
Testläufen
 Validierung im Vergleich zum hedonischen
Standardverfahren mittels 5-facher
Kreuzvalidierung und der Gütemaße
 Mean Error, RMSE / Fehler in % / Rechenzeit
 Mietpreisschätzung: 77m² große 3-
Zimmerwohnung
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
15/23
5.1(Teil-)Implementierung Ordinary Kriging
 Das einfachste Kriging Verfahren Ordinary
Kriging war allen komplexeren und dem
hedonischen Verfahren überlegen
30 ha
Infas Geodaten
Geometrie
50m Zellen
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
16/23
5.2 (Teil-)Implementierung Grid Maps
 Was ist die ideale Zellengröße für eine Mietpreiskarte?
 Methodik des Gridmapping
Filterung
von (Wohn-)
Gebäudeblöcken:
Overpass API
Angebotsdistanz,
Punktdichte
& Grundfläche
von Wohngebäuden
Zellgrößen (m) Maßstab Zoomstufe in Webmap /
OpenStreetMap
110 1: 70 000 13
75 1: 35 000 und 1: 15 000 14 und 15
>= 50 >= 1:8000 >= 16
20 -50 Nur zur Berechnung /
feinmaschige Grids
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
17/23
5.2 (Teil-)Implementierung Grid Maps
 Mietpreiskarten – Prototyp
 Zoomstufe 13 /1: 35.000
 Filterung nach Urban Atlas
 Mietpreiskarte
Status Quo des Portals
Immobilienscout 24
 Zoomstufe 13
 1: 36.000
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
18/23
5.2 (Teil-)Implementierung Grid Maps
 Mietpreiskarte IS 24
 Zoomstufe 15
 1: 14.400
Infas Geodaten
Neighboorhood
 Mietpreiskarten –
Prototyp:
 Zoomstufe 16
 1: 13.000
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
19/23
5.2 (Teil-)Implementierung Grid Maps
 Mietpreiskarten: Prototyp
und Status Quo:
 Zoomstufe 18 & 18
 1: 4500
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
20/23
6. Zusammenfassung
 Beweis für die Hypothesen konnte erbracht
werden
 Kriging Verfahren und Verfahren des
Gridmappings stellen eine deutliche
Verbesserung des Status Quo da und zeigen
die wahre Preisverteilung im Raum
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
21/23
6. Ergebnisse Beitrag zum Stand der Forschung
 Erstmalige umfassende Erhebung des
raumanalytischen und geovisuellen Status Quo von
Immobilienportalen
 Erstmalige Nutzung bzw. Adaption räumlicher
Analytik und Visualisierung zur Mietpreisanalyse-
und Darstellung für Immobilienportale
 Erstmaliger Methodentransfer in operationelles
Umfeld
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
22/23
6. Publikationen & Vorträge
 Schernthanner, H. & L. Tyrallová (2010). FOS-GIS und Immobilienportale als Instrumente der
Wohnungsmarktanalyse. In Strobl, J., Blaschke, T. & G. Griesebner, eds., Angewandte Geoinformatik
2010. Beiträge zum 22. AGIT-Symposium Salzburg, 7-9 Jul 2010. Universität Salzburg. Heidelberg.
 Schernthanner, H. (2012) Spatial analysis, forecasting and simulation of urban apartment rental
markets. Vortrag auf Einladung an das Department Landschaftsökologie / Computational Landscape
Ecology des UFZ (Umweltforschungszentrum), Leipzig.
 Schernthanner, H. & H. Asche (2012).Geosimulation of Urban Housing Market Conditions: A
Preliminary Investigation. eds. REAL-CORP 2012, Proc. 17th International Conference on Urban
Planning, Regional Development in the Information Society. Wien, Austria 14-26 May 2012.
 Schernthanner,H. (2012) Gastteilnahme am Expertengremium Potsdam 22, im Auftrag der
Stadtverordnetenversammlung der Stadt Potsdam, zur Untersuchung des Kostenanstiegs im
Wohnen: http://potsdam22.de
 Scheele, L. & Schernthanner, H. (2014). Eine räumliche Alternative der Modellierung und
Darstellung von Immobilienpreisen für Immobilienportale. In Strobl, J., Blaschke, T. & G. Griesebner,
eds., Angewandte Geoinformatik 2014. Beiträge zum 26. AGIT-Symposium Salzburg, 2-4 Jul 2014.
Universität Salzburg. Heidelberg. [ONLINE]
 Schernthanner, H. (2015): The spatial estimation of appartment rents: A brief introduction, Vortrag
im Rahmen von #Maptime Berlin
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
23/23
Vielen Dank für Ihre Aufmerksamkeit!
Fragen ?
24/23
Exemplarische (Teil-)implementierungen Random Forest
 Anwendung zur Sekundärvariablenwahl und zur
Mietpreisschätzung als Regressionsmodell an exemplarischen
Datensatz aus 1. Quartal 2015 Untersuchungsraum Potsdam
mit 1319 Objekten.
 Von Breimann (2001) entwickelte Weiterentwicklung von
Entscheidungsbäumen. Vorteil: Kann mit kategoriellen
Variablen angewendet werden
Variablenauswahl
Einteilung in Training und Testdaten
70% Test / 15% Training / 15% „Out of the bag“
Modellläufe 100 – 500 Bäume
Validierung: MSE / lnMSE%/
Node Impurity
25/23
Exemplarische (Teil-)implementierungen Random Forest
n
tree
150 350 400 300 450 250 500 200 100
MSE 1,1385 1,1391 1,1392 1,1397 1,1404 1,1407 1,1412 1,1436 1,1508
26/23
Random Forest
 Der von Breiman (2001) entwickelte Algorithmus "Random
Forest" (RF) ist eine Weiterentwicklung herkömmlicher
einfacher Entscheidungsbäume
 Die "Entscheidung" über das endgültige Resultat eines
Random Forest Modells wird über eine Anzahl an willkürlich
gewachsenen Entscheidungsbäumen bestimmt (Statsoft,
2014)
 Nur wenige Studien zur Mietpeisschätzung nutzen Random
Forest
Quelle: Imperial College London Quelle: TU Cottbus
27/23
Anwendung Künstliche Neuronale Netzwerke
 Daten werden im Verhältnis 70% / 15%/ 15% von Test,-
Trainings, und Validierungsdaten unterteilt.
 Für Antwort vom neuronalen Netz nutzt man die Variablen:
Verweildauer der Anzeige / Wohnfläche / Baujahr /
Objektalter / Zimmeranzahl und Etage
 Validierungsmaß Pseudo R²: mit 0,192 sehr gering und
großer Fehler an den zu schätzenden Punkten
28/23
Künstliche Neuronale Netzwerke
 Künstliche Neuronale Netze (Artificial neural network) sind laut
Zell (1994) informationsverarbeitende Systeme, bestehend
aus einer großen Anzahl von Einheiten, Zellen oder Neuronen
 Die Neuronen senden sich über die "Aktivierung" von Zellen
Informationen zu. Wir haben es laut Bock (1995) mit einer
abstrakten Simulation natürlicher neuronaler Netze zu tun.
 ANN bestehen aus einer Eingabeschicht, ein bis zwei
verdeckten Schichten (Hidden Layer) und einer
Ausgabeschicht.
 Diese Schichten wiederum bestehen aus Neuronen. Die
einzelnen Neuronen werden durch gerichtete Verbindungen
zusammengehalten
29/23
Künstliche Neuronale Netzwerke
 Künstliche Neuronale Netze (Artificial neural network) sind laut
Zell (1994) informationsverarbeitende Systeme, bestehend
aus einer großen Anzahl von Einheiten, Zellen oder Neuronen
 Die Neuronen senden sich über die "Aktivierung" von Zellen
Informationen zu. Wir haben es laut Bock (1995) mit einer
abstrakten Simulation natürlicher neuronaler Netze zu tun.
 ANN bestehen aus einer Eingabeschicht, ein bis zwei
verdeckten Schichten (Hidden Layer) und einer
Ausgabeschicht.
 Diese Schichten wiederum bestehen aus Neuronen. Die
einzelnen Neuronen werden durch gerichtete Verbindungen
zusammengehalten
30/23
Künstliche Neuronale Netzwerke
Quelle: RWTH Achen
31/23
©schernthanner·ifg·uni·potsdam
Hedonische Regression
 Preisschätzung von Produkten mit laufender Veränderung des
Preis-Leistungsverhältnis, bzw. einer Preisberechnung über
Qualitätsanpassung (Gordon, 1990)
 Auf Immobilien angewendet: Preisschätzung über einen
Zeitfaktor (Verfügbarkeit einer Immobilie in einer
Angebotsdatenbank) und Qualität der Immobilie (intrinische
Werte)
 Räumliche Autokorrelation wird vernachlässigt
 Determinanten der (Teil-)implementierung im Rahmen der
Promotion:
 Wohnfläche / Objektalter/ Zimmeranzahl / Etage /
Verweildauer der Anzeige
32/23
©schernthanner·ifg·uni·potsdam
Hedonische Regression Log Variante
 Funktioneller Zusammenhang zwischen zwischen
Immobilienpreis p und und Immobilieneigenschaften x
= Konstante der Regression
= Störterm
Zu schätzender
logarithmischer
Preis
Unabhängigen
Variablen
Störterm
Regressions-
konstante
33/23
Geographisch Gewichtete Regression (GWR)
 Multivariates Regressionsmodell
 Einziger Unterschied zu herkömmlicher multipler Regression ist ein
lokal eingesetzter Gewichtungsfaktor
 Über diesen können über im Raum verortete Punkte Aussagen
getroffen werden: GWR kann mit zusätzlichen Lagemodellierungen
kombiniert werden. z.B. der Netzwerkdistanz zu Bushaltestellen
Lokal geschätzte Parameter am Beobachtungspunkt i
Fehlerterm
Koordinaten am Beobachtungspunkt
34/23
Interpolation
 Interpolation =„Die Ermittlung eines unbekannten
Funktionswertes zu einem Argument, das zwischen zwei
Argumenten mit bekannten Funktionswerten (Stützwerten)
liegt“ (Geoinformatik-Service, 2002)
 Versuch Attributwerte an Punkten ohne Messergebnisse zu
schätzen
 Schätzung aus Stützpunkten = Punkte mit bekannten
Messwerten.
 “In real estate analysis, the kriging  method is used to create
interpolated maps or continuous maps ”
Anselin, L. (1998). GIS research infrastructure for spatial analysis of real estate
markets. Journal of Housing Research, 9(1), 113-133.
35/23
Kriging
 Interpolation =„Die Ermittlung eines unbekannten Funktionswertes zu
einem Argument, das zwischen zwei Argumenten mit bekannten
Funktionswerten (Stützwerten) liegt“ (Geoinformatik-Service, 2002)
 Versuch Attributwerte an Punkten ohne Messergebnisse zu schätzen
 Schätzung aus Stützpunkten = Punkte mit bekannten Messwerten
 “In real estate analysis, the kriging  method is used to create
interpolated maps or continuous maps (Anselin, 1998)”
 Ordinary Kriging nutzt zur Schätzung nur Informationen aus
den Primärvariablen, dabei wird der lokal konstante
Mittelwert geschätzt und auf den sich ergebenden Residuen
ein Simple Kriging angewendet (Li und Heap, 2008, zitiert
nach Goovaerts, 1997)
36/23
}
Kriging / Variographie
37/23
Krigining Schätzer Ordinary Kriging
 Kriging Schätzer
Zu schätzender Wert
Z der an der Position
Datenpunkte die in Schätzung miteinfließen
Kriging Gewicht,
ermittelt aus Variogramm
Konstanter,
bekannter,
stationärer
Mittelwert im
Untersuchungsgebiet
Wert der Variablen Z am Meßpunkt
Lokaler Mittelwert der
Beobachtungspunte
38/23
Validierungsrahmen
 Zur Eignungsprüfung der Verfahren ist eine Messung der
Schätzgüte bei variierenden Parameterkombinationen
notwendig.
 K – fold crossvalidation
 Angewendet wurde eine 5-fache Kreuzvalidierung der Verfahren →
aus der Menge aller Stützpunkte werden n Untermengen entfernt.
Diese dienen der Validierung
 Gütemaße: Kriterein der Auswahl: Gesamtgenauigkeit,
Verzerrungen des Modells, Sensitivität und Zuverlässigkeit des
Modells und den Rechenaufwand:
 Mean Error (ME) / RMSE (Root Mean Square Error) / Mittlere
Relative Abweichung in %: / Anteil der Datenpunkte Abweichung
<10% / Rechendauer der Modelle in Sekunden
39/23
Experteninterviews Methodik
Experten:
 „wer in irgendeiner Weise Verantwortung trägt für den Entwurf, die
Implementierung oder die Kontrolle einer Problemlösung“ bzw.
 „wer über einen privilegierten Zugang zu Informationen über
Personengruppen oder Entscheidungsprozesse verfügt.“ (nach Meuser und
Nagel (1991))
 Auswerung über die von Meuser und Nagel vorgeschlagenen Schritte:
a.) Transkription, b.) Paraphrasierung, c.) Reduktion durch Überschriften, d.)
Bereichsspezifische Analyse des Materials, e.) Thematischer Vergleich und
f.) Theoretische Generalisierung und Kategorienbildung.
 Nach der Transkription der Audiodaten lag ein 50-seitiges auswertbares
Interviewtranskript zur Auswertung vor.
 Es wurden durch die Auswertung der Experteninterviews verschiedene
Themenfelder, mit weiteren untergeordneten Problemfeldern, identifiziert.
40/23
Experteninterviews Experten
 5 Experten in 45-minütigen teilstandardisierten, qualitativen
Interviews mit Interviewleitfragen:
 Peter Ache: Autor Immobilienmarktbericht Deutschland
 Jörn-Michael Westphal: Geschäftsführer der städtischen
Immobiliengesellschaft Pro Potsdam
 Jan Hebecker: LeiterAnalytics Insight Data, IS 24
 Arne Schwarz: Leiter Produktmanagment
Immobilienbewertung IS 24
 Jan Hebecker: Transparenzoffensive Immobilienwirtschaft,
IS24
41/23
©schernthanner·ifg·uni·potsdam
Experteninterviews Themen- und Problemfelder
Immobilienpreis-
karten
Immobilienpreismodellierung Daten Angebotskarten
Fachfremd
verwendete
Grenzen
Fachfremd verwendete
Grenzen
Hedonische
Regressionsm
odelle
 
Datenschutz
 
Pin/Marker
Problematik
 
 
 
 
Legende
 
 
Datenpräprozessierung Daten
Homogenisier-
ung
Zusätzliche
Informationsebe-
nen
Datendifferenzierung
Dichteschwankungen Open Data
 
 
Indikatoren basierte,
distanzabhängige
Suche
Visualisierung
der Distanzen
 
Lagemodellierung
Ableitung Bestandspreis
42/23
Angebotsmieten Relevanz
 Angebotsmieten geben die aktuelle Marktlage wieder sind
von der Aussagekraft Neuvertragsmieten gleich zu setzen.
 Sie spiegeln in angemessener Weise die aktuelle
Marktlage wieder (BBSR, 2014).
 Datensätze wie der vorliegende sagen jedoch nichts darüber
aus, ob die Wohnungen nach der Veröffentlichung im
Immobilienportal tatsächlich vermietet wurden.
43/23
Angebotsmieten Einflussfaktoren neben Lage (für
Sekundärvariablenauswahl)
RF PCA Schnittmenge
mit Potsdam 22 Faktoren
Baujahr Baujahr Baujahr
Einbauküche Etage Zimmeranzahl
Wohnfläche Objektalter Einbauküche
Zimmeranzahl Verweildauer der Anzeige Etage
Etage Wohnfläche Wohnfläche
44/23
Räumliche Statistik und Kartendarstellung von Portalen
Immobilienp
ortal
(Räumliche) Statistik Kartendarstellung von
Immobilienpreisen
Zillow.com Hedonisches Regressionsmodell: Zillow
Price Estimate.
Pin Map der Angebotspreise.
Listendarstellung geschätzter
Preise
Trulia.com Hedonisches Regressionsmodell:
Monitoring von Miet- und Kaufpreisen
Pin map von Miet- und
Kaufpreisen
Homes.yahoo.c
om
Keine Angaben Pin map von Miet- und
Kaufpreisen
Immobilienscout
24.de
Hedonisches Regressionsmodell: IMX Mapping geschätzter Miet- und
Kaupreise gemappt auf
willkürliche geographischen
Bezugseinheit
Immowelt.de Keine Angaben Pin Map
Immonet.de Keine Angaben Keine Kartenansicht
Homegate.ch Hedonisches Regressionsmodell:
Mietindex
Pin Map
45/23
Programmiertechnische Umsetzungen
 R Bibliotheken:
 raster / spded / gstat / RandomForest
Beispiel Variogrammanpassung in R:
 fit.variogram(v, vgm(1, "Sph", 800, 1)) 
#Dieser Befehl fitted das über vgm ausgewählte parametrische Modell an
die Daten. 
 5000 Kombinatonen im Loop
Visuelle Variogrammanpassung mit geoR
v.eye <-eyefit(variog(as.geodata(Q1_2012.mp["Kalt_qm"], max.dist =
1500) )) 
ve.fit <- as.vgm.variomodel(v.eye[[1]])
#Befehl macht wandelt das Variogramm wieder für die Nutzung in gstat
Objekt um.  
46/23
Quantitative Datenbasis Angebotsdichte
47/23
Mietpreisbremse
 Ergebnisse der Arbeit können zum Mietpreismonitoring
dienen → um die progonostizierte „dämpfende“ Wirkung des
Preises zu diagnostizieren.
 Qualifizierte Mietspiegel sind nicht räumlich und einheitliche
Erfassung fehlt und Teilnahme am Mietspiegel ist nicht
verpflichtend.
48/23
Map APIs
 Unter Webkarte wird in dieser Arbeit eine webbasierte,
graphische Repräsentierung eines Datenmodells verstanden.
 Präsentationskarten, in denen ein digitaler Datenbestand
durch Attribuierung mit graphischen Merkmalen sichtbar
gemacht wird.
 Map APIs sind JavaScript-Bibliotheken, die Funktionalitäten
zur Interaktion mit der Kartengrafik bereitstellen und die
Integration von Karteninhalten von Kartenservern (meist
Tiled Map Services) ermöglichen.
 „Tiled Map Serving“ beruht dabei auf zwei Lösungsansätzen
der webbasierten Kartenbereitstellung (Peterson, 2014):
 Ajax und Map Tiles
49/23
Gebäudescharfe Mietpreisschätzdarstellung
50/23
Thematische 2,5-dimensionale Darstellung
51/23
Cloudbasierte Geovisualisierung
CartoDB, Geoserver und Mapbox
 CartoDB wird als Software as a Service (Saas) angeboten und ermöglicht
dadurch Webmapping sowie die Nutzung von GIS-Werkzeugen im
Webbrowser. CartoDB folgt dem Gedanken des Open Source Stack und
schaltet unterschiedliche freie, quelloffene Komponenten (z.B. PostGIS,
PostSQL, Mapnik) zu einer cloudbasierten Plattform zusammen
 Geoserver ist ein Java basierter OGC-(Open Geospatial Consortium-)
konformer, freier und quelloffener „Kartenserver“, welcher Web Map
Service (WMS), Web Coverage Service (WCS), Web Feature Service (WFS,
auch transaktional) und Web Processing Service (WPS) bereitstellen kann
(Geoserver, 2015).
 Mapbox (2015) ist ein proprietärer Anbieter eines TMS-Dienstes. Mapbox
erfüllt die Anforderungen an Quelloffenheit nicht, da der Stack zwar wie
CartoDB auf freien Komponenten aufsetzt, jedoch nur proprietär, über
Hostingpakete, genutzt werden kann.
52/23
Gridmapping
 Das Grid-Mapping wird als Lösungsansatz seit mehreren
Jahren von unterschiedlichen nationalen und internationalen
Behörden vor allem aus dem Statistikbereich verfolgt.
 Vorreiter für Ansätze des Grid-Mapping ist insbesondere das
U.S. Zensus Büro, welches schon in den frühen 1990er
Jahren die irregulär geformten statistischen Blöcke (US
Census Blocks) in ein nationales Grid umwandelte.
 Die „Statistik Austria“(Statistics Austria, 2013) entwickelte
ein österreichweites Grid mit unterschiedlichen
Maschenweiten (100m, 250m, 500m, 1.000m, 2.000m,
5.000m und10.000m) zur Darstellung von Bevölkerungs-,
Gebäude- und Arbeitsmarktstatistiken
53/23
Umsetzungsoptionen 1 + 2
54/23
Umsetzungsoptionen 3
55/23
Technologische Recherche
Insgesamt wurden anhand dieser Matrix 32 Immobilienportale
nach jeweils 14 Kriterien untersucht.
 Kategorie 1: Immobilienportale ohne Angebots- und
Immobilienpreiskarten. Portale dieser Kategorie wurden nicht
weiter berücksichtigt
 Kategorie 2: Immobilienportale mit Angebotskarten und
ohne Immobilienpreiskarten
 Kategorie 3: Immobilienportale mit Angebotskarten und auf
Basis der hedonischen Regression erstellter
Immobilienpreiskarten
56/23
Technologische Recherche
57/23
Räumliche Optimierung
 Promotion diskutiert den Begriff Optimierung im Rahmen der
Forschung des Promotionsprojektes
 Im Rahmen dieser Arbeit wird der Begriff der Optimierung als
eine „heuristische“ Optimierung angesehen
 Eine „optimale“ Lösung für die raumanalytischen
Unzulänglichkeiten kann nicht angeboten werden,
sondern es können nur Lösungswege eingebettet in
Anwendungsfälle aufgezeigt werden
 Es handelt sich also in dieser Arbeit um eine Optimierung im
Sinne einer geoinformatischen, heuristischen
Prozessoptimierung der räumlichen Prozesse von
Immobilienportalen
58/23
Prozess
Diese Arbeit bedient sich einer aus dem
Geschäftsumfeld kommenden Terminologie, die
einen Prozess als eine Abfolge von Tätigkeiten mit
einem Start und einem Endpunkt sieht
(Geoinformatik Lexikon, 2006).
59/23
Anwendungsfalldiagramm Raumanalyse
60/23
©schernthanner·ifg·uni·potsdam
Anwendungsfalldiagramm Geovisualisierung
61/23
Real Estate Research / Forschung eines Portals
62/23
1. Operationalisierung
Konzept / Use cases
Status Quo &
Optimierungspotentiale
Implementierung
Ergebnistransfer von
Forschungs- in
Operationelles
Umfeld
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
63/23
Räumliche Autokorrelation am Beispiel Morans I
Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse

Contenu connexe

En vedette

ACF Award En-Chieh Liu
ACF Award  En-Chieh LiuACF Award  En-Chieh Liu
ACF Award En-Chieh LiuEn Chieh Liu
 
TDC2016SP - Internet dos Elevadores, Bananas e Embaixadinhas
TDC2016SP - Internet dos Elevadores, Bananas e EmbaixadinhasTDC2016SP - Internet dos Elevadores, Bananas e Embaixadinhas
TDC2016SP - Internet dos Elevadores, Bananas e Embaixadinhastdc-globalcode
 
Информация по сертификации.ЭКспорт
Информация по сертификации.ЭКспортИнформация по сертификации.ЭКспорт
Информация по сертификации.ЭКспортBDA
 
“Actividad Final N° 2 – Didáctica Universitaria – Unida”
“Actividad Final N° 2 – Didáctica Universitaria – Unida”“Actividad Final N° 2 – Didáctica Universitaria – Unida”
“Actividad Final N° 2 – Didáctica Universitaria – Unida”liza699
 
HI-FASHION ACCESSORIES PPT-2
HI-FASHION ACCESSORIES PPT-2HI-FASHION ACCESSORIES PPT-2
HI-FASHION ACCESSORIES PPT-2Hi fashion
 
Tema 5 escuelas griegas
Tema 5 escuelas griegasTema 5 escuelas griegas
Tema 5 escuelas griegasluisfhe
 
Cinebloggie!
Cinebloggie!Cinebloggie!
Cinebloggie!Sarahf_
 
Интеллектуальная собственность. ЭКспорт
Интеллектуальная собственность. ЭКспортИнтеллектуальная собственность. ЭКспорт
Интеллектуальная собственность. ЭКспортBDA
 
TDC2016SP - Trilha DevOps Java
TDC2016SP - Trilha DevOps JavaTDC2016SP - Trilha DevOps Java
TDC2016SP - Trilha DevOps Javatdc-globalcode
 
TDC2016SP - Trilha DevOps Java
TDC2016SP - Trilha DevOps JavaTDC2016SP - Trilha DevOps Java
TDC2016SP - Trilha DevOps Javatdc-globalcode
 
Destination Management & DMO Stories. A focus on commercial strategies.
Destination Management & DMO Stories. A focus on commercial strategies.Destination Management & DMO Stories. A focus on commercial strategies.
Destination Management & DMO Stories. A focus on commercial strategies.Matteo Ciccalè
 
TDC2016SP - Trilha Fintech
TDC2016SP - Trilha FintechTDC2016SP - Trilha Fintech
TDC2016SP - Trilha Fintechtdc-globalcode
 
TDC2016SP - Trilha Embarcados
TDC2016SP - Trilha EmbarcadosTDC2016SP - Trilha Embarcados
TDC2016SP - Trilha Embarcadostdc-globalcode
 
TDC2016SP - Trilha Management 3.0
TDC2016SP - Trilha Management 3.0TDC2016SP - Trilha Management 3.0
TDC2016SP - Trilha Management 3.0tdc-globalcode
 
Disputation: Von Open Access zu Open Science: Zum Wandel digitaler Kulturen d...
Disputation: Von Open Access zu Open Science: Zum Wandel digitaler Kulturen d...Disputation: Von Open Access zu Open Science: Zum Wandel digitaler Kulturen d...
Disputation: Von Open Access zu Open Science: Zum Wandel digitaler Kulturen d...Christian Heise
 

En vedette (19)

ACF Award En-Chieh Liu
ACF Award  En-Chieh LiuACF Award  En-Chieh Liu
ACF Award En-Chieh Liu
 
TDC2016SP - Internet dos Elevadores, Bananas e Embaixadinhas
TDC2016SP - Internet dos Elevadores, Bananas e EmbaixadinhasTDC2016SP - Internet dos Elevadores, Bananas e Embaixadinhas
TDC2016SP - Internet dos Elevadores, Bananas e Embaixadinhas
 
Информация по сертификации.ЭКспорт
Информация по сертификации.ЭКспортИнформация по сертификации.ЭКспорт
Информация по сертификации.ЭКспорт
 
“Actividad Final N° 2 – Didáctica Universitaria – Unida”
“Actividad Final N° 2 – Didáctica Universitaria – Unida”“Actividad Final N° 2 – Didáctica Universitaria – Unida”
“Actividad Final N° 2 – Didáctica Universitaria – Unida”
 
HI-FASHION ACCESSORIES PPT-2
HI-FASHION ACCESSORIES PPT-2HI-FASHION ACCESSORIES PPT-2
HI-FASHION ACCESSORIES PPT-2
 
Tema 5 escuelas griegas
Tema 5 escuelas griegasTema 5 escuelas griegas
Tema 5 escuelas griegas
 
Cinebloggie!
Cinebloggie!Cinebloggie!
Cinebloggie!
 
Prix Velo Infrastruktur
Prix Velo InfrastrukturPrix Velo Infrastruktur
Prix Velo Infrastruktur
 
SAKHILE DOX
SAKHILE DOXSAKHILE DOX
SAKHILE DOX
 
Ensayo mariluz
Ensayo mariluzEnsayo mariluz
Ensayo mariluz
 
Интеллектуальная собственность. ЭКспорт
Интеллектуальная собственность. ЭКспортИнтеллектуальная собственность. ЭКспорт
Интеллектуальная собственность. ЭКспорт
 
TDC2016SP - Trilha DevOps Java
TDC2016SP - Trilha DevOps JavaTDC2016SP - Trilha DevOps Java
TDC2016SP - Trilha DevOps Java
 
TDC2016SP - Trilha DevOps Java
TDC2016SP - Trilha DevOps JavaTDC2016SP - Trilha DevOps Java
TDC2016SP - Trilha DevOps Java
 
Destination Management & DMO Stories. A focus on commercial strategies.
Destination Management & DMO Stories. A focus on commercial strategies.Destination Management & DMO Stories. A focus on commercial strategies.
Destination Management & DMO Stories. A focus on commercial strategies.
 
TDC2016SP - Trilha Fintech
TDC2016SP - Trilha FintechTDC2016SP - Trilha Fintech
TDC2016SP - Trilha Fintech
 
TDC2016SP - Trilha Embarcados
TDC2016SP - Trilha EmbarcadosTDC2016SP - Trilha Embarcados
TDC2016SP - Trilha Embarcados
 
TDC2016SP - Trilha Management 3.0
TDC2016SP - Trilha Management 3.0TDC2016SP - Trilha Management 3.0
TDC2016SP - Trilha Management 3.0
 
Disputation: Von Open Access zu Open Science: Zum Wandel digitaler Kulturen d...
Disputation: Von Open Access zu Open Science: Zum Wandel digitaler Kulturen d...Disputation: Von Open Access zu Open Science: Zum Wandel digitaler Kulturen d...
Disputation: Von Open Access zu Open Science: Zum Wandel digitaler Kulturen d...
 
Análise de poemas
Análise de poemasAnálise de poemas
Análise de poemas
 

Disputationsvortrag Schernthanner: Analyse und Visualisierung von Mietpreisdaten für Immobilienportale

  • 1. 1/23 Disputation Untersuchungen zur räumlichen Analyse und Visualisierung von Mietpreisdaten für Immobilienportale Harald Schernthanner/Geoinformatik/UP
  • 2. 2/23 Inhalt 1. Forschungsrahmen 2. Status Quo 3. Methoden 4. Quantitative Datenbasis 5. (Teil-)Implementierungen 6. Ergebnisse Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 3. 3/23 Quelle: Trulia 1. 1900 US$ Miete in ganz Manhatten? Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse Quelle: Trulia
  • 4. 4/23 1. Zehlendorf 9,27 €/m²|Potsdams Innenstadt 8-10 €/m²? Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse Quelle: Wirtschaftswoche Quelle: Immoblienscout 24 Quelle: Immonet
  • 5. 5/23 1. Forschungsprobleme 1.Erhebliche Mängel in der räumlichen Analyse von Immobilienpreisen bei Immobilienportalen 2.Erhebliche Mängel in der Geovisualisierung von Mietpreisen bei Immobilienportalen Ziel der Arbeit: Optimierung räumlicher Analysemethoden und Methoden der Geovisualisierung bei Immobilienportalen Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 6. 6/23 1. Forschungsfragen 2. Welche Methoden aus geoinformatischen Methodenspektrum können anhand realweltlicher Anforderungen von Portalen adaptiert werden? 3. Wie können die Methoden für eine Nutzung für Immobilienportale adaptiert werden? 1. Status Quo raumanalytischer und geovisueller Methoden in Portalen? ? Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 7. 7/23 1. Forschungsrahmen Hypothese 1.Verfahren der räumlichen Statistik und des maschinellen Lernens zur Mietpreisschätzung sind den bisher eingesetzten Verfahren der hedonischen Regression überlegen und eignen sich zur räumlichen Optimierung von Immobilienportalen 2.Alternative webbasierte Darstellungsformen, wie z.B. Gridmaps, sind dem Status Quo der Immobilienpreiskarten von Immobilienportalen überlegen und visualisieren die tatsächlichen räumliche Verhältnisse von Immobilienpreisen zweckmäßiger Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 8. 8/23 1. Operationalisierung Teilschritte Qualitative Analysen:  Technologische Analyse von 32 Immobilienportale  Experteninterviews mit 5 Fachexperten Quantitative Analysen:  Konzeptionelle Vorüberlegungen zu Verfahren der Raumanalyse und Geovisualisierung  Teilimplementierung der Verfahren Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 9. 9/23 2. Status Quo Prozesskette von Immoblienportalen Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse Quelle: Immonet Research ??  Mittelwert / Median  Hedonische Regression
  • 10. 10/23 2. Status Quo Hedonische Regression  Funktioneller Zusammenhang zwischen zwischen Immobilienpreis p und und Immobilieneigenschaften x  Preis wird über intrinsischen Werte einer Immobilie und deren Verfügbarkeit berechnet  Geographische Lage wird außer acht gelassen: "Everything is related to everything else, but near things are more related than distant things." Tobler, W. R. (1970). A computer movie simulating urban growth in the Detroit region. Economic geography, 234-240. Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 11. 11/23 3. Methoden: Evaluiert im Rahmen der Promotion  Es erfolgte eine umfassende Verfahrensidentifizierung und Methodenevaluierung Vorverarbeitung Maschinelles Lernen Räumliche Schätzverfahren Geovisualisierung Autokorrelationstests: Morans I/ Gearys C/ Getis-Ord Gi Random Forest Trees Geographisch gewichtete Regression Grid Maps Hauptkomponenten- analyse Künstliche Neuronale Netze Ordinary Kriginging Webkarten mit Map APIs und Java Script Kartenbibliotheken Random Forest Trees Kriging with external drift Cloudbasierte Geovisualisierungen Ordinary Cokriging Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 12. 12/23 4. Quantitative Datenbasis  Einmalige „Big Data“ Datenquelle in der sonst von Intransparenz gekennzeichneten Immobilienwirtschaft  Alle auf Immobilienscout 24 gelisteten Mietangebote der Stadt Potsdam vom ersten Quartal 2004 bis zum September 2013: 80% Marktabdeckung  Multivariater Datensatz: 74.098 geokodierte Angebote mit 64 immobilienspezifischen Variablen.  Angebotsdichte von 40 - 900 Angeboten je Stadtteil und Jahr Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 13. 13/23 5.1 (Teil-)Implementierung Ordinary Kriging  Kriging = räumliche- geostatistische Interpolationsmethode,  Kaum Anwendungen des Verfahrens auf die Mietpreisschätzung  Räumlicher Zusammenhang über die Abstandsvektoren und Nachbarschaft der Angebotspunkte Potsdam 1319 Angebote 1. Quartal 2013 Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 14. 14/23 5.1 (Teil-)Implementierung Ordinary Kriging  3 Kriging Verfahren und 3 Parameter in 120 Testläufen  Validierung im Vergleich zum hedonischen Standardverfahren mittels 5-facher Kreuzvalidierung und der Gütemaße  Mean Error, RMSE / Fehler in % / Rechenzeit  Mietpreisschätzung: 77m² große 3- Zimmerwohnung Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 15. 15/23 5.1(Teil-)Implementierung Ordinary Kriging  Das einfachste Kriging Verfahren Ordinary Kriging war allen komplexeren und dem hedonischen Verfahren überlegen 30 ha Infas Geodaten Geometrie 50m Zellen Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 16. 16/23 5.2 (Teil-)Implementierung Grid Maps  Was ist die ideale Zellengröße für eine Mietpreiskarte?  Methodik des Gridmapping Filterung von (Wohn-) Gebäudeblöcken: Overpass API Angebotsdistanz, Punktdichte & Grundfläche von Wohngebäuden Zellgrößen (m) Maßstab Zoomstufe in Webmap / OpenStreetMap 110 1: 70 000 13 75 1: 35 000 und 1: 15 000 14 und 15 >= 50 >= 1:8000 >= 16 20 -50 Nur zur Berechnung / feinmaschige Grids Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 17. 17/23 5.2 (Teil-)Implementierung Grid Maps  Mietpreiskarten – Prototyp  Zoomstufe 13 /1: 35.000  Filterung nach Urban Atlas  Mietpreiskarte Status Quo des Portals Immobilienscout 24  Zoomstufe 13  1: 36.000 Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 18. 18/23 5.2 (Teil-)Implementierung Grid Maps  Mietpreiskarte IS 24  Zoomstufe 15  1: 14.400 Infas Geodaten Neighboorhood  Mietpreiskarten – Prototyp:  Zoomstufe 16  1: 13.000 Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 19. 19/23 5.2 (Teil-)Implementierung Grid Maps  Mietpreiskarten: Prototyp und Status Quo:  Zoomstufe 18 & 18  1: 4500 Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 20. 20/23 6. Zusammenfassung  Beweis für die Hypothesen konnte erbracht werden  Kriging Verfahren und Verfahren des Gridmappings stellen eine deutliche Verbesserung des Status Quo da und zeigen die wahre Preisverteilung im Raum Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 21. 21/23 6. Ergebnisse Beitrag zum Stand der Forschung  Erstmalige umfassende Erhebung des raumanalytischen und geovisuellen Status Quo von Immobilienportalen  Erstmalige Nutzung bzw. Adaption räumlicher Analytik und Visualisierung zur Mietpreisanalyse- und Darstellung für Immobilienportale  Erstmaliger Methodentransfer in operationelles Umfeld Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 22. 22/23 6. Publikationen & Vorträge  Schernthanner, H. & L. Tyrallová (2010). FOS-GIS und Immobilienportale als Instrumente der Wohnungsmarktanalyse. In Strobl, J., Blaschke, T. & G. Griesebner, eds., Angewandte Geoinformatik 2010. Beiträge zum 22. AGIT-Symposium Salzburg, 7-9 Jul 2010. Universität Salzburg. Heidelberg.  Schernthanner, H. (2012) Spatial analysis, forecasting and simulation of urban apartment rental markets. Vortrag auf Einladung an das Department Landschaftsökologie / Computational Landscape Ecology des UFZ (Umweltforschungszentrum), Leipzig.  Schernthanner, H. & H. Asche (2012).Geosimulation of Urban Housing Market Conditions: A Preliminary Investigation. eds. REAL-CORP 2012, Proc. 17th International Conference on Urban Planning, Regional Development in the Information Society. Wien, Austria 14-26 May 2012.  Schernthanner,H. (2012) Gastteilnahme am Expertengremium Potsdam 22, im Auftrag der Stadtverordnetenversammlung der Stadt Potsdam, zur Untersuchung des Kostenanstiegs im Wohnen: http://potsdam22.de  Scheele, L. & Schernthanner, H. (2014). Eine räumliche Alternative der Modellierung und Darstellung von Immobilienpreisen für Immobilienportale. In Strobl, J., Blaschke, T. & G. Griesebner, eds., Angewandte Geoinformatik 2014. Beiträge zum 26. AGIT-Symposium Salzburg, 2-4 Jul 2014. Universität Salzburg. Heidelberg. [ONLINE]  Schernthanner, H. (2015): The spatial estimation of appartment rents: A brief introduction, Vortrag im Rahmen von #Maptime Berlin Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 23. 23/23 Vielen Dank für Ihre Aufmerksamkeit! Fragen ?
  • 24. 24/23 Exemplarische (Teil-)implementierungen Random Forest  Anwendung zur Sekundärvariablenwahl und zur Mietpreisschätzung als Regressionsmodell an exemplarischen Datensatz aus 1. Quartal 2015 Untersuchungsraum Potsdam mit 1319 Objekten.  Von Breimann (2001) entwickelte Weiterentwicklung von Entscheidungsbäumen. Vorteil: Kann mit kategoriellen Variablen angewendet werden Variablenauswahl Einteilung in Training und Testdaten 70% Test / 15% Training / 15% „Out of the bag“ Modellläufe 100 – 500 Bäume Validierung: MSE / lnMSE%/ Node Impurity
  • 25. 25/23 Exemplarische (Teil-)implementierungen Random Forest n tree 150 350 400 300 450 250 500 200 100 MSE 1,1385 1,1391 1,1392 1,1397 1,1404 1,1407 1,1412 1,1436 1,1508
  • 26. 26/23 Random Forest  Der von Breiman (2001) entwickelte Algorithmus "Random Forest" (RF) ist eine Weiterentwicklung herkömmlicher einfacher Entscheidungsbäume  Die "Entscheidung" über das endgültige Resultat eines Random Forest Modells wird über eine Anzahl an willkürlich gewachsenen Entscheidungsbäumen bestimmt (Statsoft, 2014)  Nur wenige Studien zur Mietpeisschätzung nutzen Random Forest Quelle: Imperial College London Quelle: TU Cottbus
  • 27. 27/23 Anwendung Künstliche Neuronale Netzwerke  Daten werden im Verhältnis 70% / 15%/ 15% von Test,- Trainings, und Validierungsdaten unterteilt.  Für Antwort vom neuronalen Netz nutzt man die Variablen: Verweildauer der Anzeige / Wohnfläche / Baujahr / Objektalter / Zimmeranzahl und Etage  Validierungsmaß Pseudo R²: mit 0,192 sehr gering und großer Fehler an den zu schätzenden Punkten
  • 28. 28/23 Künstliche Neuronale Netzwerke  Künstliche Neuronale Netze (Artificial neural network) sind laut Zell (1994) informationsverarbeitende Systeme, bestehend aus einer großen Anzahl von Einheiten, Zellen oder Neuronen  Die Neuronen senden sich über die "Aktivierung" von Zellen Informationen zu. Wir haben es laut Bock (1995) mit einer abstrakten Simulation natürlicher neuronaler Netze zu tun.  ANN bestehen aus einer Eingabeschicht, ein bis zwei verdeckten Schichten (Hidden Layer) und einer Ausgabeschicht.  Diese Schichten wiederum bestehen aus Neuronen. Die einzelnen Neuronen werden durch gerichtete Verbindungen zusammengehalten
  • 29. 29/23 Künstliche Neuronale Netzwerke  Künstliche Neuronale Netze (Artificial neural network) sind laut Zell (1994) informationsverarbeitende Systeme, bestehend aus einer großen Anzahl von Einheiten, Zellen oder Neuronen  Die Neuronen senden sich über die "Aktivierung" von Zellen Informationen zu. Wir haben es laut Bock (1995) mit einer abstrakten Simulation natürlicher neuronaler Netze zu tun.  ANN bestehen aus einer Eingabeschicht, ein bis zwei verdeckten Schichten (Hidden Layer) und einer Ausgabeschicht.  Diese Schichten wiederum bestehen aus Neuronen. Die einzelnen Neuronen werden durch gerichtete Verbindungen zusammengehalten
  • 31. 31/23 ©schernthanner·ifg·uni·potsdam Hedonische Regression  Preisschätzung von Produkten mit laufender Veränderung des Preis-Leistungsverhältnis, bzw. einer Preisberechnung über Qualitätsanpassung (Gordon, 1990)  Auf Immobilien angewendet: Preisschätzung über einen Zeitfaktor (Verfügbarkeit einer Immobilie in einer Angebotsdatenbank) und Qualität der Immobilie (intrinische Werte)  Räumliche Autokorrelation wird vernachlässigt  Determinanten der (Teil-)implementierung im Rahmen der Promotion:  Wohnfläche / Objektalter/ Zimmeranzahl / Etage / Verweildauer der Anzeige
  • 32. 32/23 ©schernthanner·ifg·uni·potsdam Hedonische Regression Log Variante  Funktioneller Zusammenhang zwischen zwischen Immobilienpreis p und und Immobilieneigenschaften x = Konstante der Regression = Störterm Zu schätzender logarithmischer Preis Unabhängigen Variablen Störterm Regressions- konstante
  • 33. 33/23 Geographisch Gewichtete Regression (GWR)  Multivariates Regressionsmodell  Einziger Unterschied zu herkömmlicher multipler Regression ist ein lokal eingesetzter Gewichtungsfaktor  Über diesen können über im Raum verortete Punkte Aussagen getroffen werden: GWR kann mit zusätzlichen Lagemodellierungen kombiniert werden. z.B. der Netzwerkdistanz zu Bushaltestellen Lokal geschätzte Parameter am Beobachtungspunkt i Fehlerterm Koordinaten am Beobachtungspunkt
  • 34. 34/23 Interpolation  Interpolation =„Die Ermittlung eines unbekannten Funktionswertes zu einem Argument, das zwischen zwei Argumenten mit bekannten Funktionswerten (Stützwerten) liegt“ (Geoinformatik-Service, 2002)  Versuch Attributwerte an Punkten ohne Messergebnisse zu schätzen  Schätzung aus Stützpunkten = Punkte mit bekannten Messwerten.  “In real estate analysis, the kriging  method is used to create interpolated maps or continuous maps ” Anselin, L. (1998). GIS research infrastructure for spatial analysis of real estate markets. Journal of Housing Research, 9(1), 113-133.
  • 35. 35/23 Kriging  Interpolation =„Die Ermittlung eines unbekannten Funktionswertes zu einem Argument, das zwischen zwei Argumenten mit bekannten Funktionswerten (Stützwerten) liegt“ (Geoinformatik-Service, 2002)  Versuch Attributwerte an Punkten ohne Messergebnisse zu schätzen  Schätzung aus Stützpunkten = Punkte mit bekannten Messwerten  “In real estate analysis, the kriging  method is used to create interpolated maps or continuous maps (Anselin, 1998)”  Ordinary Kriging nutzt zur Schätzung nur Informationen aus den Primärvariablen, dabei wird der lokal konstante Mittelwert geschätzt und auf den sich ergebenden Residuen ein Simple Kriging angewendet (Li und Heap, 2008, zitiert nach Goovaerts, 1997)
  • 37. 37/23 Krigining Schätzer Ordinary Kriging  Kriging Schätzer Zu schätzender Wert Z der an der Position Datenpunkte die in Schätzung miteinfließen Kriging Gewicht, ermittelt aus Variogramm Konstanter, bekannter, stationärer Mittelwert im Untersuchungsgebiet Wert der Variablen Z am Meßpunkt Lokaler Mittelwert der Beobachtungspunte
  • 38. 38/23 Validierungsrahmen  Zur Eignungsprüfung der Verfahren ist eine Messung der Schätzgüte bei variierenden Parameterkombinationen notwendig.  K – fold crossvalidation  Angewendet wurde eine 5-fache Kreuzvalidierung der Verfahren → aus der Menge aller Stützpunkte werden n Untermengen entfernt. Diese dienen der Validierung  Gütemaße: Kriterein der Auswahl: Gesamtgenauigkeit, Verzerrungen des Modells, Sensitivität und Zuverlässigkeit des Modells und den Rechenaufwand:  Mean Error (ME) / RMSE (Root Mean Square Error) / Mittlere Relative Abweichung in %: / Anteil der Datenpunkte Abweichung <10% / Rechendauer der Modelle in Sekunden
  • 39. 39/23 Experteninterviews Methodik Experten:  „wer in irgendeiner Weise Verantwortung trägt für den Entwurf, die Implementierung oder die Kontrolle einer Problemlösung“ bzw.  „wer über einen privilegierten Zugang zu Informationen über Personengruppen oder Entscheidungsprozesse verfügt.“ (nach Meuser und Nagel (1991))  Auswerung über die von Meuser und Nagel vorgeschlagenen Schritte: a.) Transkription, b.) Paraphrasierung, c.) Reduktion durch Überschriften, d.) Bereichsspezifische Analyse des Materials, e.) Thematischer Vergleich und f.) Theoretische Generalisierung und Kategorienbildung.  Nach der Transkription der Audiodaten lag ein 50-seitiges auswertbares Interviewtranskript zur Auswertung vor.  Es wurden durch die Auswertung der Experteninterviews verschiedene Themenfelder, mit weiteren untergeordneten Problemfeldern, identifiziert.
  • 40. 40/23 Experteninterviews Experten  5 Experten in 45-minütigen teilstandardisierten, qualitativen Interviews mit Interviewleitfragen:  Peter Ache: Autor Immobilienmarktbericht Deutschland  Jörn-Michael Westphal: Geschäftsführer der städtischen Immobiliengesellschaft Pro Potsdam  Jan Hebecker: LeiterAnalytics Insight Data, IS 24  Arne Schwarz: Leiter Produktmanagment Immobilienbewertung IS 24  Jan Hebecker: Transparenzoffensive Immobilienwirtschaft, IS24
  • 41. 41/23 ©schernthanner·ifg·uni·potsdam Experteninterviews Themen- und Problemfelder Immobilienpreis- karten Immobilienpreismodellierung Daten Angebotskarten Fachfremd verwendete Grenzen Fachfremd verwendete Grenzen Hedonische Regressionsm odelle   Datenschutz   Pin/Marker Problematik         Legende     Datenpräprozessierung Daten Homogenisier- ung Zusätzliche Informationsebe- nen Datendifferenzierung Dichteschwankungen Open Data     Indikatoren basierte, distanzabhängige Suche Visualisierung der Distanzen   Lagemodellierung Ableitung Bestandspreis
  • 42. 42/23 Angebotsmieten Relevanz  Angebotsmieten geben die aktuelle Marktlage wieder sind von der Aussagekraft Neuvertragsmieten gleich zu setzen.  Sie spiegeln in angemessener Weise die aktuelle Marktlage wieder (BBSR, 2014).  Datensätze wie der vorliegende sagen jedoch nichts darüber aus, ob die Wohnungen nach der Veröffentlichung im Immobilienportal tatsächlich vermietet wurden.
  • 43. 43/23 Angebotsmieten Einflussfaktoren neben Lage (für Sekundärvariablenauswahl) RF PCA Schnittmenge mit Potsdam 22 Faktoren Baujahr Baujahr Baujahr Einbauküche Etage Zimmeranzahl Wohnfläche Objektalter Einbauküche Zimmeranzahl Verweildauer der Anzeige Etage Etage Wohnfläche Wohnfläche
  • 44. 44/23 Räumliche Statistik und Kartendarstellung von Portalen Immobilienp ortal (Räumliche) Statistik Kartendarstellung von Immobilienpreisen Zillow.com Hedonisches Regressionsmodell: Zillow Price Estimate. Pin Map der Angebotspreise. Listendarstellung geschätzter Preise Trulia.com Hedonisches Regressionsmodell: Monitoring von Miet- und Kaufpreisen Pin map von Miet- und Kaufpreisen Homes.yahoo.c om Keine Angaben Pin map von Miet- und Kaufpreisen Immobilienscout 24.de Hedonisches Regressionsmodell: IMX Mapping geschätzter Miet- und Kaupreise gemappt auf willkürliche geographischen Bezugseinheit Immowelt.de Keine Angaben Pin Map Immonet.de Keine Angaben Keine Kartenansicht Homegate.ch Hedonisches Regressionsmodell: Mietindex Pin Map
  • 45. 45/23 Programmiertechnische Umsetzungen  R Bibliotheken:  raster / spded / gstat / RandomForest Beispiel Variogrammanpassung in R:  fit.variogram(v, vgm(1, "Sph", 800, 1))  #Dieser Befehl fitted das über vgm ausgewählte parametrische Modell an die Daten.   5000 Kombinatonen im Loop Visuelle Variogrammanpassung mit geoR v.eye <-eyefit(variog(as.geodata(Q1_2012.mp["Kalt_qm"], max.dist = 1500) ))  ve.fit <- as.vgm.variomodel(v.eye[[1]]) #Befehl macht wandelt das Variogramm wieder für die Nutzung in gstat Objekt um.  
  • 47. 47/23 Mietpreisbremse  Ergebnisse der Arbeit können zum Mietpreismonitoring dienen → um die progonostizierte „dämpfende“ Wirkung des Preises zu diagnostizieren.  Qualifizierte Mietspiegel sind nicht räumlich und einheitliche Erfassung fehlt und Teilnahme am Mietspiegel ist nicht verpflichtend.
  • 48. 48/23 Map APIs  Unter Webkarte wird in dieser Arbeit eine webbasierte, graphische Repräsentierung eines Datenmodells verstanden.  Präsentationskarten, in denen ein digitaler Datenbestand durch Attribuierung mit graphischen Merkmalen sichtbar gemacht wird.  Map APIs sind JavaScript-Bibliotheken, die Funktionalitäten zur Interaktion mit der Kartengrafik bereitstellen und die Integration von Karteninhalten von Kartenservern (meist Tiled Map Services) ermöglichen.  „Tiled Map Serving“ beruht dabei auf zwei Lösungsansätzen der webbasierten Kartenbereitstellung (Peterson, 2014):  Ajax und Map Tiles
  • 51. 51/23 Cloudbasierte Geovisualisierung CartoDB, Geoserver und Mapbox  CartoDB wird als Software as a Service (Saas) angeboten und ermöglicht dadurch Webmapping sowie die Nutzung von GIS-Werkzeugen im Webbrowser. CartoDB folgt dem Gedanken des Open Source Stack und schaltet unterschiedliche freie, quelloffene Komponenten (z.B. PostGIS, PostSQL, Mapnik) zu einer cloudbasierten Plattform zusammen  Geoserver ist ein Java basierter OGC-(Open Geospatial Consortium-) konformer, freier und quelloffener „Kartenserver“, welcher Web Map Service (WMS), Web Coverage Service (WCS), Web Feature Service (WFS, auch transaktional) und Web Processing Service (WPS) bereitstellen kann (Geoserver, 2015).  Mapbox (2015) ist ein proprietärer Anbieter eines TMS-Dienstes. Mapbox erfüllt die Anforderungen an Quelloffenheit nicht, da der Stack zwar wie CartoDB auf freien Komponenten aufsetzt, jedoch nur proprietär, über Hostingpakete, genutzt werden kann.
  • 52. 52/23 Gridmapping  Das Grid-Mapping wird als Lösungsansatz seit mehreren Jahren von unterschiedlichen nationalen und internationalen Behörden vor allem aus dem Statistikbereich verfolgt.  Vorreiter für Ansätze des Grid-Mapping ist insbesondere das U.S. Zensus Büro, welches schon in den frühen 1990er Jahren die irregulär geformten statistischen Blöcke (US Census Blocks) in ein nationales Grid umwandelte.  Die „Statistik Austria“(Statistics Austria, 2013) entwickelte ein österreichweites Grid mit unterschiedlichen Maschenweiten (100m, 250m, 500m, 1.000m, 2.000m, 5.000m und10.000m) zur Darstellung von Bevölkerungs-, Gebäude- und Arbeitsmarktstatistiken
  • 55. 55/23 Technologische Recherche Insgesamt wurden anhand dieser Matrix 32 Immobilienportale nach jeweils 14 Kriterien untersucht.  Kategorie 1: Immobilienportale ohne Angebots- und Immobilienpreiskarten. Portale dieser Kategorie wurden nicht weiter berücksichtigt  Kategorie 2: Immobilienportale mit Angebotskarten und ohne Immobilienpreiskarten  Kategorie 3: Immobilienportale mit Angebotskarten und auf Basis der hedonischen Regression erstellter Immobilienpreiskarten
  • 57. 57/23 Räumliche Optimierung  Promotion diskutiert den Begriff Optimierung im Rahmen der Forschung des Promotionsprojektes  Im Rahmen dieser Arbeit wird der Begriff der Optimierung als eine „heuristische“ Optimierung angesehen  Eine „optimale“ Lösung für die raumanalytischen Unzulänglichkeiten kann nicht angeboten werden, sondern es können nur Lösungswege eingebettet in Anwendungsfälle aufgezeigt werden  Es handelt sich also in dieser Arbeit um eine Optimierung im Sinne einer geoinformatischen, heuristischen Prozessoptimierung der räumlichen Prozesse von Immobilienportalen
  • 58. 58/23 Prozess Diese Arbeit bedient sich einer aus dem Geschäftsumfeld kommenden Terminologie, die einen Prozess als eine Abfolge von Tätigkeiten mit einem Start und einem Endpunkt sieht (Geoinformatik Lexikon, 2006).
  • 61. 61/23 Real Estate Research / Forschung eines Portals
  • 62. 62/23 1. Operationalisierung Konzept / Use cases Status Quo & Optimierungspotentiale Implementierung Ergebnistransfer von Forschungs- in Operationelles Umfeld Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse
  • 63. 63/23 Räumliche Autokorrelation am Beispiel Morans I Forschungsrahmen | Status Quo | Methoden | Quantitative Datenbasis |(Teil-)Implementierungen | Ergebnisse