VWO WA, 2014 - II
Wikipedia.
       
Wikipedia is een internationale internet-encyclopedie.
In maart 2012 bevatte de Nederlandstalige editie ruim één miljoen artikelen. In de tabel staan gegevens van 2012.
       
datum 22 maart 29 maart 5 april 12 april 19 april
aantal 1033414 1034660 1035882 1037184 1038340
       
Zoals in bovenstaande tabel te zien is, groeit het aantal artikelen flink.
Sommigen beweren dat hier sprake is van lineaire groei, anderen houden het op exponentiële groei.
       
4p. 1. Onderzoek elk van deze beweringen.
     

 

Over een langere periode bleek de groei sterker te worden: in de 23 weken van 19 april tot 27 september 2012 groeide de Nederlandstalige Wikipedia uit tot 1120987 artikelen.
Neem aan dat het aantal artikelen vanaf 19 april exponentieel groeide en in de toekomst met dezelfde factor blijft groeien.
       
4p. 2. Bereken het aantal artikelen op 19 april 2014.
     

 

De relatief grote omvang van de Nederlandstalige Wikipedia is voor een deel te verklaren door het grote aantal door computers gegenereerde artikelen. Het zijn wel echte artikelen maar ze zijn erg kort en geven informatie die niet bijzonder interessant is. Een voorbeeld van zo'n artikel:
       
Miedzianów
Miedzianów is een dorp in de Poolse woiwodschap Groot-Polen. De
plaats maakt deel uit van de gemeente Nowe Skalmierzyce en telt 200
inwoners.
       
Het valt niet op dat er zo veel van deze artikelen zijn. Alleen door in het beginscherm van Wikipedia een willekeurige pagina te vragen, komen deze 'computerartikelen' tevoorschijn.

In januari 2013 werd vastgesteld dat een derde deel van alle artikelen door computers gegenereerd was. Het aantal gewone artikelen groeide op dat moment exponentieel met een jaarlijkse toename van 5%. Het aantal computerartikelen groeide echter jaarlijks met 17%. Veronderstel dat de groei van beide soorten artikelen zich de jaren erna op dezelfde wijze voortzet.
       
5p. 3. Bereken na hoeveel jaar er meer computergegeneerde artikelen zullen zijn dan gewone artikelen. Geef je antwoord in maanden nauwkeurig.
     

 

Inmiddels wordt beweerd dat meer dan 40% van alle artikelen van de Nederlandstalige Wikipedia door een computer gegenereerd is. Bij een test in 2014 werden 50 willekeurige artikelen opgevraagd. Daarvan waren er 28 door een computer gegenereerd.
       
6p. 4. Onderzoek met het toetsen van hypothesen met een significantieniveau van 1% of dit voldoende reden geeft om te veronderstellen dat meer dan 40% van de artikelen computerartikelen zijn.
     

 

Touchscreens.
       
Bij het ontwerpen van touchscreens (aanraakschermen) voor moderne media als tablets en mobiele telefoons besteedt men veel aandacht aan het gebruiksgemak.
Gebruikers willen immers snel kunnen navigeren.
Op de foto zie je een touchscreen met een menu bestaande uit 13 knoppen.

De tijd die je nodig hebt om in een menu de juiste knop te vinden, hangt mede af van het aantal knoppen in het menu.
Volgens de psycholoog Hick kun je deze benodigde tijd T berekenen met de formule:

T(n) = b2log(n + 1)
 

Hierbij is T de tijd in seconden, n het aantal knoppen in het menu en b een positieve constante die afhangt van de behendigheid van de gebruiker.

In deze opgave kijken we naar dit model van Hick.
Om de juiste knop te vinden op het touchscreen van de foto heeft Irene 8 seconden nodig.
       
3p. 5. Bereken haar waarde van b in één decimaal nauwkeurig.
     

 

Pim is veel handiger met een touchscreen dan zijn vader. Hij kan in een menu met 16 knoppen even snel de juiste knop vinden als zijn vader in een menu met 4 knoppen. Dit betekent dat zijn b-waarde (bp) kleiner is dan de b-waarde van zijn vader (bv).
       
4p. 6. Onderzoek of dit betekent dat de b-waarde van Pim precies half zo groot is als die van zijn vader.
     

 

Sommige gebruikers vinden een menu met veel knoppen onoverzichtelijk.
Daarom deelt men een menu soms op in submenu's met minder knoppen.
Als er bijvoorbeeld in totaal 18 knoppen zijn, kan de ontwerper ervoor kiezen om:
 
methode I: één menu van 18 knoppen te maken  

of

   
methode II: een menu met 3 knoppen te maken, waarbij na elk van de 3 mogelijke keuzes weer een submenu met 6 knoppen verschijnt.
       
De gebruiker wint hiermee overzichtelijkheid want hij weet nu precies in welk submenu hij moet zoeken, maar hij verliest tijd omdat hij twee keer (in een menu) de juiste knop moet zien te vinden.

Als b = 0,9 duurt het keuzeproces bij methode II minstens 0,5 seconde langer dan bij methode I.
       
3p. 7. Toon met behulp van de formule voor T(n) aan dat dit juist is.
     

 

Uit de formule volgt dat één menu met alle knoppen altijd sneller werkt dan een opdeling in submenu's. Dus: één menu met p q knoppen is altijd sneller dan een hoofdmenu met p knoppen gevolgd door p submenu's met elk q knoppen.
       
4p. 8. Neem b = 1 en toon aan dat T( p) + T(q) altijd groter is dan T(pq).  
     

 

Wind mee, wind tegen.
       
Op de site buienradar.nl kun je figuur verschillende weerkaarten bekijken.
De kaarten bevatten actuele weergegevens zoals temperatuur, windkracht en windrichting. In de figuur hiernaast zie je de windkaart van Nederland op maandag 11 maart 2013 om 20:40 uur. Deze kaart is gebaseerd op gegevens van KNMI-meetstations die over Nederland zijn
verspreid. Deze meetstations geven elke 10 minuten een nieuwe waarneming af.

In Nederland zijn er 53 officiële KNMI-meetstations.
     
2p. 9. Bereken hoeveel waarnemingen er elke dag in totaal door de officiële meetstations aan het KNMI worden doorgegeven.
   

 

Als je in de ochtend van huis naar school fietst en in de middag
terugfietst, kan de wind invloed hebben op je totale reistijd. Hoe dat zit,
onderzoeken we in de rest van deze opgave.
       
Sylvia woont 10 km van school. Zij fietst elke schooldag. We gaan ervan uit dat als er geen wind is, haar snelheid constant 20  km/u is. Haar totale reistijd is op zo'n schooldag dus 1 uur.
Meestal waait het echter. We veronderstellen dat Sylvia altijd wind mee heeft op de heenweg en wind tegen op de terugweg en dat de wind de hele dag constant is. Dan is Sylvia's snelheid op de heenweg 20 + w  km/u en op de terugweg 20 - w  km/u. Hierbij geldt 0 ≤ w < 20.

Op een dag geldt w = 5. Sylvia's totale reistijd is die dag langer dan 1 uur.

       
4p. 10. Bereken hoeveel minuten haar totale reistijd die dag langer is dan 1 uur.
     

 

Sylvia's totale reistijd T in uren wordt gegeven door de formule:
   
       
De formule voor T kan worden gevonden door een formule voor de reistijd voor de heenweg en een formule voor de reistijd voor de terugweg op te stellen en deze formules bij elkaar op te tellen.
       
5p. 11. Stel deze formules op en toon daarmee aan dat de bovenstaande formule voor T juist is.
     

 

Op een dag is Sylvia's totale reistijd 1 uur en 20 minuten.
       
3p. 12. Bereken de waarde van w op die dag.  
     

 

Met de formule voor Sylvia's totale reistijd kun je zonder te rekenen beredeneren dat haar totale reistijd op een dag met wind groter is dan op een dag zonder wind.
       
3p. 13. Geef zo'n redenering.  
     

 

Dat de totale reistijd toeneemt als w toeneemt, kun je ook aantonen met behulp van de afgeleide van T.
       
5p. 14. Stel een formule op voor de afgeleide van T en toon daarmee aan dat de totale reistijd toeneemt als w toeneemt.
     

 

Financieel risico
       
Value-at-Risk-model
Sinds de financiële crisis van 2009 zijn banken verplicht hun financiële risico's extra in de gaten te houden. Een veelgebruikte manier om financieel risico in te schatten is het Value-at-Risk-model (VaR). Dit is een statistisch model dat het mogelijke verlies op een aandelenportefeuille van een bank berekent.

De maandopbrengsten van 1000 maanden van een aandelenportefeuille zijn verzameld. Deze opbrengsten zijn weergegeven in een frequentieverdeling. Zie de figuur. Langs de horizontale as zijn de maandopbrengsten gezet in duizenden euro's. Uit de figuur kun je bijvoorbeeld afleiden dat er 68 keer een maandwinst is behaald tussen €7500 en €12500. Ook kun je afleiden dat er 43 keer een verlies was tussen €22500 en €27500.
       

       
Op basis van de figuur wordt een model gemaakt. In dat model wordt gesteld dat de kans op een verlies de komende maand van €42500 of meer gelijk is aan 5%. Op basis van de figuur kan ook een schatting worden gemaakt van de kans dat de volgende maand het verlies €17500 of meer zal zijn.
       
4p. 15. Bereken deze schatting in procenten met behulp van de figuur.
     

 

De €42500 uit het voorbeeld wordt de 5%-VaR van de maandopbrengst van deze aandelenportefeuille genoemd: het bedrag dat je in een maand met een kans van 5% ten minste riskeert te verliezen.
De VaR kan ook berekend worden voor andere tijdsperioden dan een maand, bijvoorbeeld een week of 10 dagen en ook voor andere kanspercentages, bijvoorbeeld 1%.

De weekopbrengst van een bepaalde aandelenportefeuille is normaal verdeeld met een gemiddelde van €752 en een standaardafwijking van €2500. De 1%-VaR van de weekopbrengst is het verlies dat men met een kans van 1% de komende week ten minste zal lijden.
       
3p. 16. Bereken de 1%-VaR van de weekopbrengst van deze aandelenportefeuille in euro's nauwkeurig.
     

 

In het zogenoemde akkoord van Basel staan eisen voor de minimale hoeveelheid kapitaal die banken moeten aanhouden om ervoor te zorgen dat ze niet te snel in financiële problemen komen. Vereenvoudigd kan gesteld worden dat het minimaal vereiste kapitaal gelijk is aan driemaal de 1%-VaR van de tiendaagse opbrengst.
 

De dagopbrengst van een aandelenportefeuille van een bepaalde bank is normaal verdeeld met een gemiddelde van 380 000 euro en een standaardafwijking van 1,4 miljoen euro.
Aangenomen wordt dat de dagopbrengsten onafhankelijk van elkaar zijn.
De som van de dagopbrengsten is in dat geval ook normaal verdeeld.

       
5p. 17. Bereken de minimale hoeveelheid kapitaal die de bank volgens het akkoord van Basel moet aanhouden.
     

 

Risico bij leningen
Behalve met risico's bij de aandelenportefeuille heeft een bank ook te maken met het risico dat leningen niet terugbetaald worden. Om dit risico in te schatten worden personen die bij een bank geld geleend hebben verdeeld op grond van bepaalde kenmerken in risicocategorieën.
In de tabel zie je een voorbeeld van zo'n indeling voor een sterk vereenvoudigde situatie.
       
categorie aantal personen kans dat de lening niet terugbetaald wordt
A 850 95%
B 530 80%
C 260 60%
       
In dit vereenvoudigde model zijn er drie categorieën en gaan we ervan uit dat een lening ofwel helemaal terugbetaald wordt ofwel helemaal niet.
       
4p. 18. Bereken hoe groot de kans volgens het model is dat meer dan de helft van de personen in categorie C zijn lening niet terugbetaalt. Geef je antwoord in vier decimalen
     

 

Vreemde dobbelsteen
       
De investeerder Warren Buffett houdt van dobbelspelletjes met ongebruikelijke dobbelstenen. Hij daagt Bill Gates, de oprichter van Microsoft, uit voor een spelletje waarbij ze allebei een dobbelsteen mogen werpen. Degene met het hoogste ogenaantal wint.
Ze gebruiken drie dobbelstenen: een blauwe, een groene en een rode. De ogenaantallen staan in de volgende tabel.
       
blauw  3 3 3 3 3 6
groen  2 2 2 5 5 5
rood  1 4 4 4 4 4
       
Warren laat Bill als eerste een dobbelsteen kiezen, en nadat Bill de blauwe pakt, kiest Warren de rode dobbelsteen.
       
3p. 19. Bereken de kans dat Warren wint.  
     

 

Even later spelen Warren en Bill weer tegen elkaar, maar de spelregels zijn veranderd. Er zijn nu twee blauwe, twee groene en twee rode dobbelstenen. Warren kiest twee dobbelstenen van gelijke kleur, waarna Bill twee andere dobbelstenen van gelijke kleur moet kiezen. De winnaar is degene met de hoogste som van zijn ogenaantallen.
Warren begint. Hij kiest de twee rode dobbelstenen. De kansverdeling voor de som van zijn ogenaantallen staat in de volgende tabel.
       
som 2 5 8
kans 1/36 10/36 25/36
       
Bill kiest de twee groene dobbelstenen.
       
6p. 20. Bereken de kans dat Bill wint.  
     

 

 

UITWERKING
   
Het officiële (maar soms beknoptere) correctievoorschrift kun je HIER vinden. Vooral handig voor de onderverdeling van de punten.
   
1. De data nemen regelmatig toe (elke keer +7 dagen)

Als de toename lineair is, dan moeten de waarden elke keer met dezelfde hoeveelheid toenemen.
De toenames zijn:
1034660 - 1033414 = 1246
1035882 - 1034660 = 1222
1037184 - 1035882 = 1302
1038340 - 1037184 = 1156
Dat is steeds verschillend dus de toename is niet lineair.

Als de toename exponentieel is, dan moeten de waarden elke keer met dezelfde factor vermenigvuldigd worden.
1034660/1033414 = 1,0012
1035882/1034660 = 1,0012
1037184/1035882 = 1,0013
1038340/1037184 = 1,0011
Dat is ongeveer gelijk dus de groei is exponentieel.
   
2. Het aantal is gegroeid met factor 1120987/1038340 = 1,0796
Dat is in 23 weken, dus voor de groeifactor per week geldt  g23 = 1,0796
Dan is g = 1,0796(1/23) = 1,0033
Na 52 weken is de hoeveelheid dan  1038340 · 1,003352 =
1234634 artikelen.
   
3. Als het aantal computerartikelen 1/3 deel van het totaal is, dan is het aantal gewone artikelen dubbel zo groot als het aantal computerartikelen.
Voor de gewone artikelen geldt  A = B · 1,05t
Voor de computerartikelen geldt  A = 0,5B · 1,17t
Als die gelijk zijn is  B • 1,05t = 0,5B • 1,17t
1,05t = 0,5 • 1,17t
Y1 = 1,05^X  en  Y2 = 0,5 * 1,17^X en dan intersect geeft X = t = 6,4 jaar
Dat is 6,4 • 12 =
77 maanden

Het kan ook algebraïsch natuurlijk:
1,05t = 0,5 • 1,17t
(1,05/1,17)t = 0,5
0,897t = 0,5
t = log(0,5)/log(0,897) = 6,4
   
4. H0p = 0,40
H1p > 0,40
meting is 28 van de 50
overschrijdingskans:  P(X 28) = 1 - P(X 27) = 1 - binomcdf(50, 0.40, 27) = 0,016
Dat is groter dan a (0,01), dus H0 wordt aangenomen
Er is
GEEN reden om te veronderstellen dat meer dan 40% van de artikelen computerartikelen zijn.
   
5. 8 = b2log(13 + 1)
8 = bLOG14/LOG2
8 = b • 3,807
b = 2,1
   
6. bP2log(16 + 1) = bV2log(4 + 1)
bP2log17 = bV2log5
bP4,087 = bV • 2,322
bP = 2,322/4,087 bV
b
P = 0,57 • bV
dat is niet precies de helft. 
   
7. methode I:   T = 0,9 • 2log(19) = 0,9 • LOG19/LOG2 = 3,82
methode II:  T = 0,9 • 2log(4) + 0,9• 2log(7) = 1,8 + 2,53 = 4,33
Dat is 4,33 - 3,82 =
0,51 seconden langer en dat is inderdaad meer dan 0,5.
   
8. T(p) + T(q) = 1• 2log(p + 1) + 1 • 2log(q + 1)
= 2log(p + 1) + 2log(q + 1) = 2log((p + 1)(q + 1)) = 2log(pq + p + q + 1)

T(pq) = 1 • 2log(pq + 1) = 2log(pq + 1)

omdat pq + p + q + 1  > pq + 1   is ook  log(pq + p + q + 1) > log(pq + 1)  want logx is een stijgende functie
Dus is  T(p) + T(q) > T(pq)
   
9. Elk station geeft 24 • 6 = 144 waarnemingen per dag
Dat zijn  144 • 53 =
7632 waarnemingen per dag.
   
10. heenweg:  tijd is  10/(20 + 5) = 0,4 uur
terugweg: tijd is  10/(20 - 5) = 2/3 uur
Samen is dat 16/15 uur en dat is 1 uur en 4 minuten.
Dat is dus
4 minuten langer.
   
11. theen = 10/(20 + w)  en  tterug = 10/(20 - w)  dus samen geeft dat:
   
 
   
12. 1 uur en 20 minuten is 4/3 uur
4/3 = 400/(400 - w²)
4 • (400 - w2) = 1200
1600 - 4w2 = 1200
4w2 = 400
w2 = 100
w = 10
   
13. w2  is altijd groter dan nul,
dan is 400 - w2  kleiner dan 400
dan is  400/(400 - w2)  groter dan 1
dus T > 1 als w > 0
   
14. T = 400 • (400 - w2)-1
T ' = -1 • 400 • (400 - w2)-2 • -2w
T ' = 800w/(400 - w2)2
de teller is groter dan nul (want w > 0)
de noemer is groter dan nul (het is een kwadraat)
dus is T ' groter dan nul, dus de functie T is overal stijgend
Dat betekent dat T toeneemt als w toeneemt.
   
15. Een verlies van 17500 of meer dat zijn de 11 meest linker staafjes. (tot en met het staafje waar -20 in staat)
Tel die op: 1 + 4 + 3 + 9 + 12 + 21 + 23 + 32 + 36 + 43 + 58 = 242
dat is
 24,2% van 1000
   
16. Onder de 1%-VaR zit nog 1% van de normale verdeling.
normalcdf(-1099, X, 752, 2500) = 0,01
Y1 = normalcdf(-1099, X, 752, 2500) en Y2 = 0,01
intersect geeft
-5064
   
17. μ10 = 10 • 380000 = 3800000
σ10 = 1400000 • 10
bereken de 1% VaR als in vraag 16:
normalcdf(-1099 , X, 3800000, 140000010) = 0,01
intersect geeft nu  X = -6,5 • 106
De voorraad moet dan minimaal 3 • 6,5 • 106 =
19,5 miljoen zijn
   
18. Het aantal dat niet terugbetaalt is binomiaal verdeeld.
n = 260
p = 0,4
P(X > 130) = 1 - P(X 130) - 1 - binomcdf(260, 0.4, 130) =
0,0004
   
19. P(Warren wint) = P(4rood-3 blauw) = 5/65/6 = 25/36
   
20. Bill wint op de volgende manieren:
A. Warren gooit 2
B. Warren gooit 5 en Bill gooit 10 of 7   (dus  W(5) en B(55 of 52))
C. Warren gooit 8 en Bill gooit 10

De kansen daarop zijn
A.  1/36
B.  10/36 • (3/63/6 + 3/63/6 • 2) = 5/24
C.  25/363/63/6 = 25/144
Samen is dat
59/144