VWO WA, 2014 - II | ||
Wikipedia. | |||||||||||||||
Wikipedia is een internationale internet-encyclopedie. In maart 2012 bevatte de Nederlandstalige editie ruim één miljoen artikelen. In de tabel staan gegevens van 2012. |
|||||||||||||||
|
|||||||||||||||
Zoals in
bovenstaande tabel te zien is, groeit het aantal artikelen flink. Sommigen beweren dat hier sprake is van lineaire groei, anderen houden het op exponentiële groei. |
|||||||||||||||
4p. | 1. | Onderzoek elk van deze beweringen. | |||||||||||||
Over een langere
periode bleek de groei sterker te worden: in de 23 weken van 19 april
tot 27 september 2012 groeide de Nederlandstalige Wikipedia uit tot 1120987 artikelen. Neem aan dat het aantal artikelen vanaf 19 april exponentieel groeide en in de toekomst met dezelfde factor blijft groeien. |
|||||||||||||||
4p. | 2. | Bereken het aantal artikelen op 19 april 2014. | |||||||||||||
De relatief grote omvang van de Nederlandstalige Wikipedia is voor een deel te verklaren door het grote aantal door computers gegenereerde artikelen. Het zijn wel echte artikelen maar ze zijn erg kort en geven informatie die niet bijzonder interessant is. Een voorbeeld van zo'n artikel: | |||||||||||||||
|
|||||||||||||||
Het valt niet op
dat er zo veel van deze artikelen zijn. Alleen door in het beginscherm
van Wikipedia een willekeurige pagina te vragen, komen deze
'computerartikelen' tevoorschijn. In januari 2013 werd vastgesteld dat een derde deel van alle artikelen door computers gegenereerd was. Het aantal gewone artikelen groeide op dat moment exponentieel met een jaarlijkse toename van 5%. Het aantal computerartikelen groeide echter jaarlijks met 17%. Veronderstel dat de groei van beide soorten artikelen zich de jaren erna op dezelfde wijze voortzet. |
|||||||||||||||
5p. | 3. | Bereken na hoeveel jaar er meer computergegeneerde artikelen zullen zijn dan gewone artikelen. Geef je antwoord in maanden nauwkeurig. | |||||||||||||
Inmiddels wordt beweerd dat meer dan 40% van alle artikelen van de Nederlandstalige Wikipedia door een computer gegenereerd is. Bij een test in 2014 werden 50 willekeurige artikelen opgevraagd. Daarvan waren er 28 door een computer gegenereerd. | |||||||||||||||
6p. | 4. | Onderzoek met het toetsen van hypothesen met een significantieniveau van 1% of dit voldoende reden geeft om te veronderstellen dat meer dan 40% van de artikelen computerartikelen zijn. | |||||||||||||
Touchscreens. | |||
Bij het ontwerpen van touchscreens
(aanraakschermen) voor moderne media als tablets en mobiele
telefoons besteedt men veel aandacht aan het gebruiksgemak. Gebruikers willen immers snel kunnen navigeren. Op de foto zie je een touchscreen met een menu bestaande uit 13 knoppen. De tijd die je nodig hebt om in een menu de juiste knop te vinden, hangt mede af van het aantal knoppen in het menu. Volgens de psycholoog Hick kun je deze benodigde tijd T berekenen met de formule: T(n) = b • 2log(n + 1) |
|
||
Hierbij is T de tijd in seconden, n
het aantal knoppen in het menu en b een positieve constante
die afhangt van de behendigheid van de gebruiker. In deze opgave kijken we naar dit model van Hick. Om de juiste knop te vinden op het touchscreen van de foto heeft Irene 8 seconden nodig. |
|||
3p. | 5. | Bereken haar waarde van b in één decimaal nauwkeurig. | |
Pim is veel handiger met een touchscreen dan zijn vader. Hij kan in een menu met 16 knoppen even snel de juiste knop vinden als zijn vader in een menu met 4 knoppen. Dit betekent dat zijn b-waarde (bp) kleiner is dan de b-waarde van zijn vader (bv). | |||
4p. | 6. | Onderzoek of dit betekent dat de b-waarde van Pim precies half zo groot is als die van zijn vader. | |
Sommige gebruikers vinden een menu met
veel knoppen onoverzichtelijk. Daarom deelt men een menu soms op in submenu's met minder knoppen. Als er bijvoorbeeld in totaal 18 knoppen zijn, kan de ontwerper ervoor kiezen om: |
|||
methode I: | één menu van 18 knoppen te maken | ||
of |
|||
methode II: | een menu met 3 knoppen te maken, waarbij na elk van de 3 mogelijke keuzes weer een submenu met 6 knoppen verschijnt. | ||
De gebruiker wint hiermee
overzichtelijkheid want hij weet nu precies in welk submenu hij moet
zoeken, maar hij verliest tijd omdat hij twee keer (in een menu) de
juiste knop moet zien te vinden. Als b = 0,9 duurt het keuzeproces bij methode II minstens 0,5 seconde langer dan bij methode I. |
|||
3p. | 7. | Toon met behulp van de formule voor T(n) aan dat dit juist is. | |
Uit de formule volgt dat één menu met alle knoppen altijd sneller werkt dan een opdeling in submenu's. Dus: één menu met p • q knoppen is altijd sneller dan een hoofdmenu met p knoppen gevolgd door p submenu's met elk q knoppen. | |||
4p. | 8. | Neem b = 1 en toon aan dat T( p) + T(q) altijd groter is dan T(p • q). | |
Wind mee, wind tegen. | |||
Op de site buienradar.nl
kun je figuur verschillende weerkaarten bekijken. De kaarten bevatten actuele weergegevens zoals temperatuur, windkracht en windrichting. In de figuur hiernaast zie je de windkaart van Nederland op maandag 11 maart 2013 om 20:40 uur. Deze kaart is gebaseerd op gegevens van KNMI-meetstations die over Nederland zijn verspreid. Deze meetstations geven elke 10 minuten een nieuwe waarneming af. In Nederland zijn er 53 officiële KNMI-meetstations. |
|||
2p. | 9. | Bereken hoeveel waarnemingen er elke dag in totaal door de officiële meetstations aan het KNMI worden doorgegeven. | |
Als je in de ochtend van huis naar
school fietst en in de middag terugfietst, kan de wind invloed hebben op je totale reistijd. Hoe dat zit, onderzoeken we in de rest van deze opgave. |
|||
Sylvia woont 10 km van school. Zij
fietst elke schooldag. We gaan ervan uit dat als er geen wind is,
haar snelheid constant 20 km/u is. Haar
totale reistijd is op zo'n schooldag dus 1 uur. Meestal waait het echter. We veronderstellen dat Sylvia altijd wind mee heeft op de heenweg en wind tegen op de terugweg en dat de wind de hele dag constant is. Dan is Sylvia's snelheid op de heenweg 20 + w km/u en op de terugweg 20 - w km/u. Hierbij geldt 0 ≤ w < 20. Op een dag geldt w = 5. Sylvia's totale reistijd is die dag langer dan 1 uur. |
|||
4p. | 10. | Bereken hoeveel minuten haar totale reistijd die dag langer is dan 1 uur. | |
Sylvia's totale reistijd T in uren wordt gegeven door de formule: | |||
De formule voor T kan worden gevonden door een formule voor de reistijd voor de heenweg en een formule voor de reistijd voor de terugweg op te stellen en deze formules bij elkaar op te tellen. | |||
5p. | 11. | Stel deze formules op en toon daarmee aan dat de bovenstaande formule voor T juist is. | |
Op een dag is Sylvia's totale reistijd 1 uur en 20 minuten. | |||
3p. | 12. | Bereken de waarde van w op die dag. | |
Met de formule voor Sylvia's totale reistijd kun je zonder te rekenen beredeneren dat haar totale reistijd op een dag met wind groter is dan op een dag zonder wind. | |||
3p. | 13. | Geef zo'n redenering. | |
Dat de totale reistijd toeneemt als w toeneemt, kun je ook aantonen met behulp van de afgeleide van T. | |||
5p. | 14. | Stel een formule op voor de afgeleide van T en toon daarmee aan dat de totale reistijd toeneemt als w toeneemt. | |
Financieel risico | |||||||||||||||
Value-at-Risk-model Sinds de financiële crisis van 2009 zijn banken verplicht hun financiële risico's extra in de gaten te houden. Een veelgebruikte manier om financieel risico in te schatten is het Value-at-Risk-model (VaR). Dit is een statistisch model dat het mogelijke verlies op een aandelenportefeuille van een bank berekent. De maandopbrengsten van 1000 maanden van een aandelenportefeuille zijn verzameld. Deze opbrengsten zijn weergegeven in een frequentieverdeling. Zie de figuur. Langs de horizontale as zijn de maandopbrengsten gezet in duizenden euro's. Uit de figuur kun je bijvoorbeeld afleiden dat er 68 keer een maandwinst is behaald tussen €7500 en €12500. Ook kun je afleiden dat er 43 keer een verlies was tussen €22500 en €27500. |
|||||||||||||||
|
|||||||||||||||
Op basis van de figuur wordt een model gemaakt. In dat model wordt gesteld dat de kans op een verlies de komende maand van €42500 of meer gelijk is aan 5%. Op basis van de figuur kan ook een schatting worden gemaakt van de kans dat de volgende maand het verlies €17500 of meer zal zijn. | |||||||||||||||
4p. | 15. | Bereken deze schatting in procenten met behulp van de figuur. | |||||||||||||
De €42500 uit het voorbeeld wordt de 5%-VaR
van de maandopbrengst van deze aandelenportefeuille genoemd: het
bedrag dat je in een maand met een kans van 5% ten minste riskeert
te verliezen. De VaR kan ook berekend worden voor andere tijdsperioden dan een maand, bijvoorbeeld een week of 10 dagen en ook voor andere kanspercentages, bijvoorbeeld 1%. De weekopbrengst van een bepaalde aandelenportefeuille is normaal verdeeld met een gemiddelde van €752 en een standaardafwijking van €2500. De 1%-VaR van de weekopbrengst is het verlies dat men met een kans van 1% de komende week ten minste zal lijden. |
|||||||||||||||
3p. | 16. | Bereken de 1%-VaR van de weekopbrengst van deze aandelenportefeuille in euro's nauwkeurig. | |||||||||||||
In het zogenoemde akkoord van Basel
staan eisen voor de minimale hoeveelheid kapitaal die banken moeten
aanhouden om ervoor te zorgen dat ze niet te snel in financiële
problemen komen. Vereenvoudigd kan gesteld worden dat het minimaal
vereiste kapitaal gelijk is aan driemaal de 1%-VaR van de tiendaagse
opbrengst. De dagopbrengst van een aandelenportefeuille van een bepaalde bank is
normaal verdeeld met een gemiddelde van 380 000 euro en een
standaardafwijking van 1,4 miljoen euro. |
|||||||||||||||
5p. | 17. | Bereken de minimale hoeveelheid kapitaal die de bank volgens het akkoord van Basel moet aanhouden. | |||||||||||||
Risico bij leningen Behalve met risico's bij de aandelenportefeuille heeft een bank ook te maken met het risico dat leningen niet terugbetaald worden. Om dit risico in te schatten worden personen die bij een bank geld geleend hebben verdeeld op grond van bepaalde kenmerken in risicocategorieën. In de tabel zie je een voorbeeld van zo'n indeling voor een sterk vereenvoudigde situatie. |
|||||||||||||||
|
|||||||||||||||
In dit vereenvoudigde model zijn er drie categorieën en gaan we ervan uit dat een lening ofwel helemaal terugbetaald wordt ofwel helemaal niet. | |||||||||||||||
4p. | 18. | Bereken hoe groot de kans volgens het model is dat meer dan de helft van de personen in categorie C zijn lening niet terugbetaalt. Geef je antwoord in vier decimalen | |||||||||||||
Vreemde dobbelsteen | |||||||||||
De investeerder Warren Buffett houdt van
dobbelspelletjes met ongebruikelijke dobbelstenen. Hij daagt Bill
Gates, de oprichter van Microsoft, uit voor een spelletje waarbij ze
allebei een dobbelsteen mogen werpen. Degene met het hoogste
ogenaantal wint. Ze gebruiken drie dobbelstenen: een blauwe, een groene en een rode. De ogenaantallen staan in de volgende tabel. |
|||||||||||
|
|||||||||||
Warren laat Bill als eerste een dobbelsteen kiezen, en nadat Bill de blauwe pakt, kiest Warren de rode dobbelsteen. | |||||||||||
3p. | 19. | Bereken de kans dat Warren wint. | |||||||||
Even later spelen Warren en Bill weer
tegen elkaar, maar de spelregels zijn veranderd. Er zijn nu twee
blauwe, twee groene en twee rode dobbelstenen. Warren kiest twee
dobbelstenen van gelijke kleur, waarna Bill twee andere dobbelstenen
van gelijke kleur moet kiezen. De winnaar is degene met de hoogste
som van zijn ogenaantallen. Warren begint. Hij kiest de twee rode dobbelstenen. De kansverdeling voor de som van zijn ogenaantallen staat in de volgende tabel. |
|||||||||||
|
|||||||||||
Bill kiest de twee groene dobbelstenen. | |||||||||||
6p. | 20. | Bereken de kans dat Bill wint. | |||||||||
UITWERKING | |
Het officiële (maar soms beknoptere) correctievoorschrift kun je HIER vinden. Vooral handig voor de onderverdeling van de punten. | |
1. | De data nemen
regelmatig toe (elke keer +7 dagen) Als de toename lineair is, dan moeten de waarden elke keer met dezelfde hoeveelheid toenemen. De toenames zijn: 1034660 - 1033414 = 1246 1035882 - 1034660 = 1222 1037184 - 1035882 = 1302 1038340 - 1037184 = 1156 Dat is steeds verschillend dus de toename is niet lineair. Als de toename exponentieel is, dan moeten de waarden elke keer met dezelfde factor vermenigvuldigd worden. 1034660/1033414 = 1,0012 1035882/1034660 = 1,0012 1037184/1035882 = 1,0013 1038340/1037184 = 1,0011 Dat is ongeveer gelijk dus de groei is exponentieel. |
2. | Het aantal is
gegroeid met factor 1120987/1038340 = 1,0796 Dat is in 23 weken, dus voor de groeifactor per week geldt g23 = 1,0796 Dan is g = 1,0796(1/23) = 1,0033 Na 52 weken is de hoeveelheid dan 1038340 · 1,003352 = 1234634 artikelen. |
3. | Als het aantal computerartikelen
1/3 deel
van het totaal is, dan is het aantal gewone artikelen dubbel zo groot als
het aantal computerartikelen. Voor de gewone artikelen geldt A = B · 1,05t Voor de computerartikelen geldt A = 0,5B · 1,17t Als die gelijk zijn is B • 1,05t = 0,5B • 1,17t 1,05t = 0,5 • 1,17t Y1 = 1,05^X en Y2 = 0,5 * 1,17^X en dan intersect geeft X = t = 6,4 jaar Dat is 6,4 • 12 = 77 maanden Het kan ook algebraïsch natuurlijk: 1,05t = 0,5 • 1,17t (1,05/1,17)t = 0,5 0,897t = 0,5 t = log(0,5)/log(0,897) = 6,4 |
4. | H0:
p = 0,40 H1: p > 0,40 meting is 28 van de 50 overschrijdingskans: P(X ≥ 28) = 1 - P(X ≤ 27) = 1 - binomcdf(50, 0.40, 27) = 0,016 Dat is groter dan a (0,01), dus H0 wordt aangenomen Er is GEEN reden om te veronderstellen dat meer dan 40% van de artikelen computerartikelen zijn. |
5. | 8 = b •
2log(13 + 1) 8 = b • LOG14/LOG2 8 = b • 3,807 b = 2,1 |
6. | bP
• 2log(16 + 1) = bV • 2log(4 +
1) bP • 2log17 = bV • 2log5 bP • 4,087 = bV • 2,322 bP = 2,322/4,087 • bV bP = 0,57 • bV dat is niet precies de helft. |
7. | methode I:
T = 0,9 • 2log(19) = 0,9 • LOG19/LOG2 =
3,82 methode II: T = 0,9 • 2log(4) + 0,9• 2log(7) = 1,8 + 2,53 = 4,33 Dat is 4,33 - 3,82 = 0,51 seconden langer en dat is inderdaad meer dan 0,5. |
8. | T(p) + T(q)
= 1• 2log(p + 1) + 1 • 2log(q + 1)
= 2log(p + 1) + 2log(q + 1) = 2log((p + 1)(q + 1)) = 2log(pq + p + q + 1) T(pq) = 1 • 2log(pq + 1) = 2log(pq + 1) omdat pq + p + q + 1 > pq + 1 is ook log(pq + p + q + 1) > log(pq + 1) want logx is een stijgende functie Dus is T(p) + T(q) > T(pq) |
9. | Elk station geeft
24 • 6 = 144 waarnemingen per dag Dat zijn 144 • 53 = 7632 waarnemingen per dag. |
10. | heenweg:
tijd is 10/(20 + 5) = 0,4 uur terugweg: tijd is 10/(20 - 5) = 2/3 uur Samen is dat 16/15 uur en dat is 1 uur en 4 minuten. Dat is dus 4 minuten langer. |
11. | theen = 10/(20 + w) en tterug = 10/(20 - w) dus samen geeft dat: |
12. | 1 uur en 20
minuten is 4/3
uur 4/3 = 400/(400 - w²) 4 • (400 - w2) = 1200 1600 - 4w2 = 1200 4w2 = 400 w2 = 100 w = 10 |
13. | w2
is altijd groter dan nul, dan is 400 - w2 kleiner dan 400 dan is 400/(400 - w2) groter dan 1 dus T > 1 als w > 0 |
14. | T = 400 • (400 -
w2)-1 T ' = -1 • 400 • (400 - w2)-2 • -2w T ' = 800w/(400 - w2)2 de teller is groter dan nul (want w > 0) de noemer is groter dan nul (het is een kwadraat) dus is T ' groter dan nul, dus de functie T is overal stijgend Dat betekent dat T toeneemt als w toeneemt. |
15. | Een verlies van
17500 of meer dat zijn de 11 meest linker staafjes. (tot en met het
staafje waar -20 in staat) Tel die op: 1 + 4 + 3 + 9 + 12 + 21 + 23 + 32 + 36 + 43 + 58 = 242 dat is 24,2% van 1000 |
16. | Onder de 1%-VaR
zit nog 1% van de normale verdeling. normalcdf(-1099, X, 752, 2500) = 0,01 Y1 = normalcdf(-1099, X, 752, 2500) en Y2 = 0,01 intersect geeft -5064 |
17. | μ10 = 10 • 380000 = 3800000 σ10 = 1400000 • √10 bereken de 1% VaR als in vraag 16: normalcdf(-1099 , X, 3800000, 1400000√10) = 0,01 intersect geeft nu X = -6,5 • 106 De voorraad moet dan minimaal 3 • 6,5 • 106 = 19,5 miljoen zijn |
18. | Het aantal dat
niet terugbetaalt is binomiaal verdeeld. n = 260 p = 0,4 P(X > 130) = 1 - P(X ≤ 130) - 1 - binomcdf(260, 0.4, 130) = 0,0004 |
19. | P(Warren wint) = P(4rood-3 blauw) = 5/6 • 5/6 = 25/36 |
20. | Bill wint op de
volgende manieren: A. Warren gooit 2 B. Warren gooit 5 en Bill gooit 10 of 7 (dus W(5) en B(55 of 52)) C. Warren gooit 8 en Bill gooit 10 De kansen daarop zijn A. 1/36 B. 10/36 • (3/6 • 3/6 + 3/6 • 3/6 • 2) = 5/24 C. 25/36 • 3/6 • 3/6 = 25/144 Samen is dat 59/144 |