Teksten Vergelijken | |||
In ziekenhuizen worden vaak medische rapporten geschreven. Bij een onderzoek naar de inhoud van dergelijke rapporten zijn 2500 rapporten van het Elkerliek Ziekenhuis (ELK) te Deurne vergeleken met 2500 rapporten van het Academisch Ziekenhuis Maastricht (AZM) Van elk rapport is de lengte bepaald: de lengte van een rapport is het aantal woorden dat het bevat. In de volgende figuur zijn de gegevens weergegeven in een gecombineerd staafdiagram met klassenbreedte 10. | |||
Voor de lengte van de rapporten van de ene
verzameling geldt: I: 1e kwartiel is 68, mediaan is 100, 3e kwartiel is 149. Voor de lengte van de rapporten van de andere verzameling geldt: |
||||||||||||||||||||||||||||||||||||
3p | 10. | Welke van deze serie gegevens, I of II, hoort bij de rapporten van het ELK? Licht je antwoord toe. | ||||||||||||||||||||||||||||||||||
Uit het onderzoek bleek dat de mediaan en het gemiddelde die horen bij de rapporten van het AZM niet even groot zijn. | ||||||||||||||||||||||||||||||||||||
4p | 11. | Geef met een redenering, dus zonder een berekening, aan of de mediaan groter of kleiner is dan het gemiddelde. | ||||||||||||||||||||||||||||||||||
De rapporten van beide ziekenhuizen bevatten samen 996734 woorden. Toch waren er in totaal slechts ongeveer 20000 verschillende woorden. Dit komt omdat er woorden zijn die heel vaak gebruikt worden. Om je hiervan een idee te geven zie je in de volgende tabel de tien woorden die het meest frequent in de rapporten werden gebruikt. | ||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
Je ziet dat in de tabel de
woorden op rangnummer, in volgorde van hun frequentie, zijn
genoemd. Zo kun je bijvoorbeeld aflezen dat het woord `met` in totaal
27667 keer is geteld en dat dit woord het rangnummer 4 heeft.
De onderzoekers J.B. Estoup en G.K. Zipf hebben geprobeerd in
allerlei teksten een verband te vinden tussen het rangnummer r
van een woord en de bijbehorende frequentie f. In 1949 vond Zipf
de formule:
|
||||||||||||||||||||||||||||||||||||
Deze formule wordt ook wel de
"wet van Zipf" genoemd. De waarde van C hangt af van het totale aantal woorden in de tekst. Volgens Zipf is C de oplossing van de vergelijking:
De rapporten van het AZM bevatten samen 495378 woorden. |
||||||||||||||||||||||||||||||||||||
3p | 12. | Bereken de waarde van C die bij de rapporten van het AZM hoort. Rond af op duizendtallen. | ||||||||||||||||||||||||||||||||||
Voor de 996734 woorden in de
rapporten van beide ziekenhuizen samen geldt C = 88000. In de
figuur hieronder zijn van alle gebruikte woorden de frequenties uitgezet
tegen de rangnummers. Op beide assen is gekozen voor een logaritmische
schaalverdeling. De woorden uit de tabel hierboven vind je terug als de
bovenste 10 punten. Om de wet van Zipf en de werkelijkheid met elkaar te kunnen vergelijken is in onderstaande figuur ook de grafiek van fr = 88000/r getekend. |
||||||||||||||||||||||||||||||||||||
De wet van Zipf geldt voor algemene teksten zoals krantenartikelen en dergelijke. Omdat medische rapporten niet "algemeen" zijn, vertonen de grafieken opmerkelijke verschillen. Tussen de rangnummers 2 en (ongeveer) 2200 zijn de werkelijke frequenties groter dan de frequenties volgens de wet van Zipf. | ||||||||||||||||||||||||||||||||||||
4p | 13. | Onderzoek of dit verschil bij r = 100 groter is dan bij r = 500. Licht je antwoord toe. | ||||||||||||||||||||||||||||||||||
Al doende leert men | |||||||||||||||||
In de Amerikaanse industrie is ooit
onderzocht hoe snel werknemers leren wanneer zij een handeling vaker
verrichten. Bij een groot aantal werknemers is bijgehouden hoeveel tijd
ze nodig hadden om een bepaalde handeling voor de eerste keer te
verrichten, hoeveel tijd voor de tweede keer, enz.
Zo bleken werknemers 16 minuten nodig te hebben om handeling A voor de eerste keer te verrichten. Bij de tweede keer was die handelingstijd 12,8 minuten. Dus wanneer een werknemer handeling A twee keer heeft uitgevoerd is zijn gemiddelde handelingstijd (16 + 12,8)/2 = 14,4 minuten. Deze 14,4 minuten zie je in de volgende tabel. De andere waarden in deze tabel zijn op een vergelijkbare manier berekend. |
|||||||||||||||||
|
|||||||||||||||||
Met behulp van deze tabel kunnen we berekenen dat een werknemer 8,1 minuten nodig heeft om handeling A voor de 5e keer te verrichten. | |||||||||||||||||
3p | 14. | Geef zo'n berekening. | |||||||||||||||
Wanneer we de gemiddelde
handelingstijd Hn willen uitrekenen voor meer
dan zes handelingen is het handig te beschikken over een formule voor Hn.
Hiertoe zijn verschillende pogingen ondernomen. E้n zo'n poging
resulteerde in de formule:
Deze formule komt redelijk overeen met de gegevens van de tabel voor n = 1 tot en met n = 6. |
|||||||||||||||||
3p | 15. | Bereken het grootste verschil tussen de uitkomsten uit de tabel en de bijbehorende waarden van Hn. | |||||||||||||||
Voor grote waarden van n is de formule voor Hn echter niet geschikt om de gemiddelde handelingstijd te beschrijven. | |||||||||||||||||
4p | 16. | Leg uit waarom de formule voor Hn niet geschikt is. | |||||||||||||||
Het is niet zo eenvoudig een formule voor
Hn te vinden die wel voldoet.
Toch kunnen we bijvoorbeeld de gemiddelde handelingstijd na 10 handelingen uitrekenen. Daarbij maken we gebruik van Tn, de tijd die een werknemer nodig heeft om handeling A voor de n-de keer te verrichten. Tn kan goed worden benaderd met de formule:
In deze formule is Tn in minuten. Inderdaad
levert deze formule T1 ป 16 en T2
ป 12,8 |
|||||||||||||||||
4p | 17. | Bereken hoe groot de gemiddelde handelingstijd is wanneer een werknemer 10 keer handeling A heeft uitgevoerd. | |||||||||||||||
Koelkasten | |||||||||||||||||||||||
Tegenwoordig worden koelkasten voorzien van
een energiesticker. Op deze sticker staat vermeld in welke energieklasse
de koelkast zit. Deze energieklassen worden aangegeven met de letters A
tot en met G. Een koelkast in klasse A gebruikt weinig energie, een
koelkast in klasse G gebruikt veel energie. In de figuur hiernaast zie
je een voorbeeld van zo'n sticker die hoort bij een koelkast uit
energieklasse A.
Om te bepalen in welke energieklasse een koelkast moet worden ingedeeld, wordt het energieverbruik vergeleken met het zogenaamde standaardenergieverbruik van dat type koelkast. Hiermee berekent men de EEI, de energie-effici๋ntie-index van de koelkast. Dat gebeurt met behulp van de volgende formule: |
|||||||||||||||||||||||
De waarde van deze EEI bepaalt in welke energieklasse de koelkast wordt ingedeeld. Zie de volgende tabel: | |||||||||||||||||||||||
|
|||||||||||||||||||||||
Een koelkast heeft een energieverbruik van 330 kWh per jaar en is ingedeeld in klasse B. | |||||||||||||||||||||||
3p | 18. | Bereken de grootste mogelijke waarde van het bijbehorende standaardenergieverbruik | |||||||||||||||||||||
Om het gebruik van energiezuinige
koelkasten te stimuleren, geeft de overheid subsidie voor koelkasten in
klasse A. Bij aanschaf van een koelkast in klasse A krijgt de koper 50 subsidie
Van twee koelkasten, de Freezer en de Icebox, zijn enkele gegevens bekend. Zie de volgende tabel. |
|||||||||||||||||||||||
|
|||||||||||||||||||||||
De prijs van elektriciteit is 0,20 per
kWh De Icebox is duurder in aanschaf, maar verbruikt minder energie in vergelijking met de Freezer. Dat betekent dat na verloop van tijd de extra investering in de Icebox zal zijn terugverdiend. In januari van het jaar 2000 heeft iemand een Icebox gekocht. |
|||||||||||||||||||||||
5p | 19. | Bereken in welke maand van welk jaar de extra investering in de Icebox zal zijn terugverdiend. | |||||||||||||||||||||
Bij de berekening
van de EEI moeten we weten hoe groot het standaardenergieverbruik
van een koelkast is. Dit wordt voor elk type koelkast apart
uitgerekend. Hiervoor gebruikt men de volgende formule:
In deze formule is GV het Gecorrigeerd Volume; dit wordt berekend met de formule:
In deze formule is K het volume van de koelruimte en V het volume van de Vriesruimte, beide in liters. Om deze twee formules te kunnen gebruiken hebben we dus de waarden van m, n en s nodig. In de volgende tabel staan voor een aantal categorie๋n koelkasten deze waarden aangegeven. |
|||||||||||||||||||||||
|
|||||||||||||||||||||||
Voor elke
categorie koelkasten is de formule voor het standaardenergieverbruik
van de vorm:
Hierbij zijn a, b en c constanten. Ook hier is K weer de inhoud van de koelruimte en V de inhoud van de vriesruimte, beide in liters. |
|||||||||||||||||||||||
5p | 20. | Hoe groot zijn de constanten a, b en c voor de categorie koelkasten met vriesruimte ** ? | |||||||||||||||||||||
Er bestaan ook
koelkasten met vriesruimte ***. Voor deze categorie koelkasten geldt de
formule:
Een fabrikant van koelkasten wil een nieuw type koelkast met vriesruimte*** op de markt brengen. Dit nieuwe type moet voldoen aan de volgende voorwaarden: |
|||||||||||||||||||||||
|
|||||||||||||||||||||||
4p | 21. | Onderzoek hoe groot de inhoud van de vriesruimte moet zijn om aan deze voorwaarden te voldoen. |
OPLOSSINGEN | |||||||||||||||||||||||||||||
Het offici๋le (maar soms beknoptere) correctievoorschrift kun je HIER vinden. Vooral handig voor de onderverdeling van de punten. | |||||||||||||||||||||||||||||
1. | De kans dat een auto
niet gekeurd wordt is 0,97. De kans dat geen ้้n van vijf auto's wordt gekeurd is dan 0,975 = 0,8587 |
||||||||||||||||||||||||||||
2. | Het aantal foute
keuringen moet dan 1 of 0 zijn. binomcdf(5, 0.2 , 1) = 0,7373 of binompdf(5, 0.2 , 0) + binompdf(5, 0.2 , 1) = 0,7373 |
||||||||||||||||||||||||||||
3. | De kans op 1,5
strafpunten is 0,1 en de kans op 0,4 bonuspunten is 0,9. Gemiddeld geeft dat per auto -1,5 0,1 + 0,4 0,9 = 0,21 punten. Voor 8 auto's zal dat gemiddeld 8 0,21 = 1,68 punten opleveren. |
||||||||||||||||||||||||||||
4. | Voor een schatting
van de gemiddelde levensduur doen we alsof alle metingen zich bij het
klassenmidden bevinden. De klassenmiddens zijn : 2,5 en 7,5 en 12,5 en 17,5 en 22,5 De percentages zijn ongeveer (aflezen) : 3, 10, 68, 18 en 1 Het gemiddelde is dan (2,5 3 + 7,5 10 + 12,5 68 + 17,5 18 + 22,5 1)/100 = 12,7 (invoeren in L1 (middens) en L2 (percentages) en dan 1-var-stats (L1,L2) kan natuurlijk ook) |
||||||||||||||||||||||||||||
5. | Eerst krijgt de
eerste speler 13 kaarten van de 52. Dat kan op 52 nCr 13 manieren. Daarna krijgt de tweede speler 13 kaarten van de overgebleven 39. Dat kan op 39 nCr 13 manieren. Dan krijgt de derde speler 13 kaarten van de overgebleven 26. Dat kan op 26 nCr 13 manieren. Voor de laatste speler zijn dan nog 13 kaarten over. Totaal geeft dat (52 nCr 13) (39 nCr 13) (26 nCr 13) 1 = 5,36 1028 manieren. Dat is dus groter dan 5 1025 |
||||||||||||||||||||||||||||
6. | ้้n mogelijke
volgorde is eerst 2 klaveren en dan 11 anderen. De kans daarop is (13/52) (12/51) (39/50) (38/49) (37/48) (36/47) ... (29/40) ≈ 0,00264 Er zijn 13 nCr 2 = 78 zulke volgorden De kans wordt dan 78 0,00264 ≈ 0,2059 of kies 2 klaveren uit de 13; dat kan op 13 nCr 2 = 78 manieren kies 11 andere kaarten uit de 39. Dat kan op 39 nCr 11 = 1676056044 manieren. samen kan dat op 78 1676056044 = 1,307 1011 manieren. in totaal zijn er 52 nCr 13 = 6,35 1011 manieren om 13 willekeurige kaarten uit de 52 te kiezen. De kans dat het 2 klaveren en 11 anderen wordt is dan (1,307 1011)/( 6,35 1011) = 0,2059 |
||||||||||||||||||||||||||||
7. | Je verwacht
gemiddeld 13/4 = 3,25 klaverenkaarten, immers de
13 kaarten worden onder 4 spelers verdeeld. Het gemiddelde van de tabel is (0 130 + 1 802 + ... + 8 12 + 9 0)/10000 = 3,2471 Dat komt inderdaad vrijwel overeen. |
||||||||||||||||||||||||||||
8. | De kans op geen
klaveren is 0,013 1 van de 10 keer heeft dan kans binompdf(10 , 0.013 , 1) = 0,1156 of: kans op geen klaveren in 0,013, en op wel dus 1 - 0,013 = 0,987 1 van de 10 heeft dan kans 10 nCr 1 0,0131 0,9879 = 0,1156 |
||||||||||||||||||||||||||||
9. | Volgens de tabel is
de kans op hoogstens 4 klaveren (130 + 802 + 2060 + 2865 + 2385)/10000 =
0,8242 Volgens de normale verdeling is deze kans normalcdf(0, 4.5 , 3.25 , 1.365) = 0,8115 Het verschil is groter dan 0,01. |
||||||||||||||||||||||||||||
10. | De staven van ELK
liggen meer naar links dan die van AZM. Dus zal het eerste kwartiel van ELK kleiner zijn dan dat van AZM. Daarom hoort serie I bij ELK en II bij AZM. |
||||||||||||||||||||||||||||
11. | Aan de rechterkant
liggen de gegevens verder uit elkaar (de staafjes zijn kleiner en er
zijn er meer van) Daarom zal de mediaan kleiner zijn dan het gemiddelde. |
||||||||||||||||||||||||||||
12. | 2,3 C logC =
495378 Deze is niet algebra๏sch op te lossen. Dus Y1 = 2,3 X logX en Y2 = 495378 Dan intersect levert (met bijv. window Xmin = 0, Xmax = 100000, Ymin = 0, Ymax = 1000000): X = C = 46175,539 en dat is afgerond op duizendtallen 46000 |
||||||||||||||||||||||||||||
13. | Bij r = 100
is het verschil ongeveer 1800 - 800 = 1000 Bij r = 500 is het verschil ongeveer 350 - 150 = 200 Dus het verschil bij r = 100 is groter dan bij r = 500 |
||||||||||||||||||||||||||||
14. | Vijf keer
handeling A kost in totaal 5 11,3 = 56,5 minuten Vier keer handeling A kost in totaal 4 12,2 = 48,4 minuten. Dus kostte de vijfde keer 56,5 - 48,4 = 8,1 minuten. |
||||||||||||||||||||||||||||
15. | Y1=0,14X^2 - 2X +
17,8 geeft de volgende extra rijen in de tabel:
Het grootste verschil is 0,14, bij n = 6 |
||||||||||||||||||||||||||||
16. | De grafiek van Hn is een dalparabool, dus de waarden van Hn worden uiteindelijk weer groter als n groter wordt. Maar de gemiddelde handelingstijd moet steeds kleiner worden, dus dat kan niet samengaan. | ||||||||||||||||||||||||||||
17. | Je moet T1
tot en met T10 bij elkaar optellen. Dat kan bijvoorbeeld zo: Stat - Edit: L1 = 1,2,3,4,5,6,7,8,9,10 en L2 = 6 + 14,70,68^L1 dan list - math - sum(L2) geeft 90,57716336 Voor de gemiddelde tijd moet je door 10 delen, en dat geeft ongeveer 9,1 minuten |
||||||||||||||||||||||||||||
18. | Het
standaardenergieverbruik is het grootst als EEI het kleinst is. De kleinste EEI is 55%, en dat geeft dan 55 = 330/S 100 ofwel S = 330/0,55 = 600 kWh per jaar |
||||||||||||||||||||||||||||
19. | De aanschafprijs van
de Icebox is met subsidie 995 - 50 = 945 Dat is 945 - 795 = 150 euro duurder dan de Freezer. Per jaar verbruikt de Icebox 480-360 = 120 kWh minder, dat bespaart 120 0,20 = 24 euro. Om 150 euro te besparen kost dat dan 150/24 = 6,25 jaar. 6,25 jaar na januari 2000 is april 2006. |
||||||||||||||||||||||||||||
20. | standaardenergieverbruik
= m GV + n = m (K + s V) + n
= m K + m s V + n vergelijk de formules: m = a en m s = b en n = c Dat geeft eerst a = 0,450 daarna b = 0,450 1,85 = 0,8325 c = n = 245 |
||||||||||||||||||||||||||||
21. | K = 4V invullen in
de formule: standaardenergieverbruik = 0,675 4 V + 1,41255 V + 235 = 4,04055 V + 235 Dit moet meer dan 340 zijn. 4,04055 V + 235 = 340 ⇒ 4,04055 V = 105 ⇒ V = 25,986... De inhoud van de vriesruimte moet dus minstens 26 liter zijn. |