-
Notifications
You must be signed in to change notification settings - Fork 0
/
Logboek
72 lines (48 loc) · 4.92 KB
/
Logboek
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
We vinden een dependency tussen het contactmedium en de maand.
Dit was niet verwacht maar lijkt wel overeen te komen met de data, na inspectie hiervan.
We denken dat het bedrijf gewoon van strategie is veranderd gedurende het jaar.
We voegen in het model een pijl van maand naar medium toe.
We vinden een dependency tussen default en contactmedium geconditoned op age en job.
Omdat contactmedium zo sterk beïnvloed lijkt te worden door maand lijkt het ons het meest waarschijnlijk dat default wordt beïnvloed door maand.
Het is ook niet onredelijk te stellen dat sommige maanden duurder zijn dan anderen, en dus correlleren met het aantal defaults.
We voegen een pijl toe van maand naar default.
We vinden een dependency tussen education en contact geconditioneerd op age.
We voegen een pijl toe van education naar contact.
Education en duration werden als dependent gevonden geconditioneerd op like 5 variabelen.
We hebben een latent variabele (common cause) toegevoegd die voor geduld staat.
We vinden een dependency tussen loan en housing geconditioneerd op age, job en marital status.
Ook is er een dependency tussen education en y.
We voegen een latent toe "willingness to take loan" en verbinden age, marital status en education hiermee.
Deze latent verbinden we met loan en housing.
Ook verwijderen we de directe edges die dezen hadden met loan en housing.
Er bleef nog een dependency tussen wealth en contactmedium.
Hiervoor voegen we een latent "wealth toe" en verwijderen we "willingness to take a loan" omdat deze sterk samenhangen.
Nu lijken alle onbedoelde dependencies verdwenen te zijn.
We testen het verwijderen van patience omdat dat effect (afhankelijkheid tussen education en duration) misschien nu verklaard zou worden via wealth, maar het lijkt dat die toch betekenisvol is.
We testen of een pijl van education naar duraction direct ook kan en dat lijkt idd het geval. We verwijderen patience.
We testen of de pijlen uit day_of_week daadwerkelijk betekenisvol zijn.
Dit lijkt niet het geval. We verwijderen alle pijlen vanuit day_of_week.
We testen of de pijlen uit campaign invloed hebben.
Lijkt ook niet het geval, verwijderen de pijlen.
We twijfelen aan het nut van duration.
We kiezen ervoor om duration uit het model te gooien en volgende week te kijken of de economische waarden weer kunnen herintroduceren om 1. het model weer wat complexer te maken en 2. aan te sluiten bij de application uit onze exposee.
Binnen leeftijd met grenzen: >=18, >25, >30, >45, >=60
Consumer confidence: =(S2<-45)*1+(S2<-38)*1+(S2<-35)*1 (range 0 tm 3)
Price index: =(R2/1000<92.6)*1+(R2/1000<93.3)*1+(R2/1000<93.6)*1+(R2/1000<94.3)*1 (range 0 tm 4)
Emp var rate: =(Q2<-2.1)*1+(Q2<-0.5)*1+(Q2<0.5)*1 (range 0 tm 3)
Euribor: =(T2/1000<3)*1 (range 0 tm 1)
Nr employed: =(U2<5050)*1+(U2<5150)*1 (range 0 tm 3)
Economische variabelen:
We trekken pijlen van maand naar elke economische variabele omdat het (3-)maandelijkse indicatoren zijn, en een pijl van elke economische indicator naar de uitkomst y.
Pijl van nr.employed naar cons.conf.idx, dit is één van de dingen die gemeten wordt om de confidence te bepalen.
Pijl van emp.var.rate naar confidence, en van price index naar confidence. Intuitie: als variatie in nr.employed hoog is dan komen en gaan er veel banen, dit heeft veel invloed op confidence.
Euribor3m is het gemiddelde van rente van Europese banken. Banken bepalen hun rente op basis van het huidige economische klimaat. Pijl van alle economische variabelen naar e3m.
Emp.var.rate en nr.employed naar cons.price.idx.
Pijlen van confidence, nr.employed en price index naar default, vanwege hoge RMSEA waarde. Intuitie: als confidence en prijs goed zijn doen bedrijven/zzp-ers het beter, dus dan is het minder waarschijnlijk dat ze geld in default hebben.
LocalTests faalt omdat euribor3m maar 2 unieke waarden heeft (ook vanwege binning), en er wat combinaties van geconditioneerd waarden niet voorkomen. Oplossing: verwijder e3m. Dit kan omdat de invloed van e3m wordt uitgeoefend in de andere economische variabelen.
We vinden vrij hoge RMSEA waarden tussen marital en economische variabelen, geconditioneerd op andere economische variabelen. Dit is een gekke dependency. We vermoeden dat de strategie van het bedrijf is veranderd over de tijd, en dat ze meer/minder getrouwde/gescheiden mensen zijn gaan bellen.
Pijl van price index en confidence naar loan vanwege hoge RMSEA waarde. Intuitie: als prijzen hoger zijn hebben mensen sneller een loan nodig.
Pijl van price indec en confidence naar housing vanwege rmsea. Intuitie: hogere confidence, meer huizenkoop.
Pijl van emp.var.rate naar default: als delta laag is dan meer mensen in default (failliet).
Pijl van emp.var.rate naar housing en default: als delta hoog dan meer mensen stabiele baan, en dan kunnen ze een hypotheek/lening afsluiten.
Omdat zowel emp.var.rate en nr.employed indicatoren zijn voor het aantal werkenden verbinden we ook nr.employed met housing en loan, om dezelfde reden dat we emp.var.rate met deze verbonden.