Első elemzésként
szerettem volna egy eléggé aktuális témát és mivel a kézi VB épp ilyen, ezért
gondoltam, hogy pár dolgot megvizsgálok a csapatokkal kapcsolatban.
Elsőként a magyar
csapattal kapcsolatban megnézem, hogy a különféle változók, amiket nemsokára
pontosítok, hogy hatottak a világversenyeken elért eredményünkre, volt e
egyáltalán kapcsolat közöttük.
Az írás második
részében megvizsgálom, hogy a 24 résztvevő csapat közül mely csapatok
hasonlítanak jobban egymásra bizonyos változók szerint.
Változók
forrásai: handball.hu és serbia2013.com
1. Magyar
válogatott
A változókat meg
kellett alkotni, képezni, ilyen formában nem találtam őket. Adatbázis
összeállításánál vannak megkötések. Van, hogy nincs elég adat, de általában az
szokott lenni, hogy csapatok keretszáma nem egyezik meg ezért változó számú
elemből kellett képezni különböző években. Ez tehát csak a valóság egy közelítő
megközelítése csupán, de nem is kell néha jobbat megkövetelni, ebben az esetben
ez megfelelő.
hely
|
koratlag
|
magatlag
|
meccsatlag
|
meccsossz
|
golatlag
|
golossz
|
sulyatlag
|
||
3
|
26,47
|
177,35
|
80,59
|
1370
|
184,47
|
3136
|
69,52
|
2012
|
EB
|
10
|
25,59
|
177,11
|
70
|
1190
|
118,88
|
2021
|
69,59
|
2010
|
EB
|
9
|
23,81
|
177,12
|
34,5
|
552
|
69,06
|
1105
|
68,13
|
2009
|
VB
|
8
|
24,25
|
177,25
|
58,19
|
931
|
100,75
|
1612
|
69
|
2008
|
EB
|
4
|
25,5
|
176,29
|
87,28
|
1222
|
161,5
|
2261
|
69
|
2008
|
OL
|
8
|
25,56
|
176,19
|
87,38
|
1398
|
186,19
|
2979
|
68,69
|
2007
|
VB
|
5
|
25,75
|
175,56
|
71,88
|
1150
|
149,38
|
2390
|
68,81
|
2006
|
EB
|
3
|
25,25
|
176,13
|
69
|
1104
|
116,13
|
1858
|
68,5
|
2005
|
VB
|
Megvizsgálom,
hogy a magyar válogatott mindenkori keretére jellemző változók és az
eredményesség között van e valamilyen kapcsolat.
Láthatjuk, hogy
melyik évben mely eseményen, hányadik helyen végzett a csapat.
A keretre
jellemző változók kor, magasság, súly, összes válogatottbeli lejátszott meccs,
összes válogatottban dobott gól. A meccs és gólátlag egy játékosra esik, ha
megszorozzuk a keretszámmal, akkor kapjuk meg az összesítettet.
Azt láthatjuk, az
adatokból, hogy 2005-ben VB bronzot nyertek a lányok, a következő évben EB 5.
hely se rossz, de a 2007-es VB eredmény ezután már annyira nem fényes. Pedig
látjuk egy elég tapasztalt csapattal vettünk részt. Foghatjuk arra, hogy
olimpiára időzítettünk, ami elég jól sikerült.
Olimpia után egy
jelentős fiatalításon esett át a csapat és ennek köszönhetően a tavalyi EB-ig
nem jöttek az eredmények, de látjuk, hogy a keret 2009 óta mennyi tapasztalatot
gyűjtött.
Megnézem van e
kapcsolat a helyezés és a többi változó között. A módszer a lineáris
regressziószámítás. 8 megfigyeléshez csak egy magyarázóváltozót használhatok.
Megcsinálom
mindegyikre.
Pl:
elsőre
Model 1: OLS, using observations 1-8
Dependent variable: hely
Coefficient
|
Std. Error
|
t-ratio
|
p-value
|
||
const
|
51,2289
|
28,7425
|
1,7823
|
0,12497
|
|
koratlag
|
-1,77976
|
1,13674
|
-1,5657
|
0,16846
|
Mean
dependent var
|
6,250000
|
S.D.
dependent var
|
2,815772
|
|
Sum
squared resid
|
39,40208
|
S.E.
of regression
|
2,562619
|
|
R-squared
|
0,290053
|
Adjusted
R-squared
|
0,171728
|
|
F(1,
6)
|
2,451330
|
P-value(F)
|
0,168464
|
|
Log-likelihood
|
-17,72902
|
Akaike
criterion
|
39,45803
|
|
Schwarz
criterion
|
39,61692
|
Hannan-Quinn
|
38,38643
|
Azt kaptam, hogy
egyik változó sincs kapcsolatban a helyezéssel, mert egyik modellhez tartozó
magyarázóváltozó se fontos a modellben 5 százalékos szignifikancia szinten.
Tehát azt tudom
mondani, hogy a csapat helyezése nincs kapcsolatban külön külön a változókkal.
Többet nem tudok mondani.
2. VB mezőny
24 csapat van
jelen a VB-n. Sajnos Kongóról semmilyen adatot nem közöl a hivatalos oldal.
Norvégia illetve Németország nem adta meg a játékosai súlyát. Kongót nem tudtam
belevenni sehogy így 23 csapat maradt. Norvégi és Németország megkapta az
átlagos értéket, hogy őket figyelembe tudjam venni valahogy.
3 változót
találtam mindenkihez: kor, súly, magasság. Ezekből képeztem a csapatátlagokat.
orszag
|
kor
|
mag
|
suly
|
ALG
|
27,625
|
177,81
|
74,68
|
ANG
|
26,125
|
175,44
|
72,88
|
ARG
|
22,75
|
173,64
|
71,6
|
AUS
|
26,12
|
172,76
|
69,41
|
BRA
|
25,18
|
175
|
68,79
|
CHN
|
22,36
|
177,63
|
69,9
|
CZE
|
24,79
|
174,46
|
69,43
|
DEN
|
24,03
|
176,93
|
71,6
|
DOM
|
21,57
|
173,93
|
68,21
|
ESP
|
27,39
|
174
|
69,18
|
FRA
|
27
|
175,33
|
67,93
|
GER
|
25,6
|
177,81
|
69,3
|
HUN
|
25,71
|
176,6
|
69,1
|
JPN
|
26,24
|
166,9
|
61
|
KOR
|
23,68
|
171,96
|
64,18
|
MNE
|
24,13
|
176,63
|
69,94
|
NED
|
23,38
|
176
|
70,88
|
NOR
|
27,31
|
174,31
|
69,3
|
PAR
|
21,47
|
170,56
|
67,62
|
POL
|
26,5
|
177,54
|
71,86
|
ROU
|
26,25
|
176,46
|
69,89
|
SRB
|
26,71
|
176,75
|
71,6
|
TUN
|
24,46
|
174,71
|
65,64
|
Pl: HUN – magyar
csapat átlagkora 25,71 év, átlag 176,6 cm magas és átlag 69,1 kg.
A módszer most a
klaszterelemzés lesz. Megnézem mely csapatok hasonlítanak egymáshoz jobban és
miért. Azt kell tudni, hogy a klaszterelemzés a 23 csapatot besorolja vagy az
általam megadott számú csoportba. Az, hogy mennyit mondok egy feltáró elemzés
részeként állítódik elő.
Én most 5
csoportot választottam és megnéztem mi lett az eredmény.
Ez a táblázat tartalmazza a csoportonkénti elemszámot.
Number of Cases in each
Cluster
|
||
Cluster
|
1
|
4,000
|
2
|
1,000
|
|
3
|
3,000
|
|
4
|
9,000
|
|
5
|
6,000
|
|
Valid
|
23,000
|
|
Missing
|
,000
|
1
|
ALG
|
1
|
ANG
|
5
|
ARG
|
4
|
AUS
|
4
|
BRA
|
5
|
CHN
|
4
|
CZE
|
5
|
DEN
|
3
|
DOM
|
4
|
ESP
|
4
|
FRA
|
5
|
GER
|
4
|
HUN
|
2
|
JPN
|
3
|
KOR
|
5
|
MNE
|
5
|
NED
|
4
|
NOR
|
3
|
PAR
|
1
|
POL
|
4
|
ROU
|
1
|
SRB
|
4
|
TUN
|
A
csoportbeosztás:
1: ALG, ANG, POL, SRB
2: JPN
3: DOM, KOR, PAR
4: AUS, BRA, CZE, ESP, FRA, HUN, NOR, ROU, TUN
5: ARG, CHN, DEN, GER, MNE, NED
Magyarázat:
1 – magas kor,
magas magasság, több súly
2 – kis magasság,
kis súly
3 – kicsi kor
4 – átlagos
értékek
5 – egy vagy két
változóban magas érték
0 Megjegyzések