Data är inte allt – men det kan vara både kul och lärorikt att använda som stöd vid tippning.
Jag har samlat ihop en rad olika datapunkter och byggt en modell som förutspår poäng per lag i SHL 2025/26.
Det finns självklart hur många variabler som helst att välja på, men här är de jag använt i version 1:
points_last_year
: poäng förra säsongenpoints_2_years_ago
: poäng för två säsonger sedantable_pos_last_year
: tabellplacering senastavg_scored_last_year
: snittmål framåtavg_conceded_last_year
: snittmål bakåtis_allsvenskan_last_year
: spelade laget i HA förra året?is_allsvenskan_2_years_ago
: spelade i HA för två år sen?percent_returning_players
: andel kvarvarande spelarepercent_returning_TP
: andel poäng från föregående säsong som finns kvarprev_GP_SHL
: antal SHL-matcher i truppen innan säsongenprev_TP_SHL
: SHL-poäng i truppen innan säsongenprev_GP_SHL_GK
: SHL-matcher för målvakterprevious_seasons_coach
: antal säsonger tränaren varit kvar i klubben
📈 Korrelationsanalys
En enkel start är att kolla på korrelationer.
Detta visar endast linjära samband, men ger ändå en fingervisning.
Som väntat har tidigare poäng och SHL-rutin i truppen tydlig positiv korrelation.
Negativ korrelation ses exempelvis för lag som kom från HockeyAllsvenskan.
👉 Kika själv i dashboarden här -> flik säsongsstatistik
🤖 Feature Importance (XGBoost)
Nu blir det lite mer nördigt.
Eftersom världen inte är linjär behöver vi en modell som klarar mer komplexa samband. Jag har använt XGBoost, en välbeprövad modell inom prediktion.
Den låter oss se hur viktig varje variabel är för prediktionen – alltså feature importance.
Det betyder inte att variabeln är bra eller dålig, utan hur mycket modellen använt den för att förutsäga poäng.
Vi kan också visualisera detta som ett kluster med:
- Y-axel = “gain” (hur mycket prediktionen påverkas)
- X-axel = “weight” (hur ofta variabeln används)
🟨 Topp vänster (sällan men hög impact)
is_allsvenskan_2_years_ago
table_pos_last_year
→ Variabler som används sällan, men när de gör det är påverkan stark.
🟦 Kluster i mitten
prev_TP_SHL
,avg_conceded_last_year
,is_allsvenskan_last_year
→ Balancerade, stabila prediktorer med tydlig påverkan.
🟧 Botten höger (används ofta, mindre effekt)
points_last_year
,points_2_years_ago
,percent_returning_TP
,percent_returning_players
→ Fungerar som stabiliserande input – modellen använder dem ofta men de skiftar inte så mycket.
⚫ Botten mitten (svaga)
avg_scored_last_year
,previous_seasons_coach
,prev_GP_SHL_GK
,prev_GP_SHL
→ Variabler som generellt har låg påverkan.
🎯 Modellens tippning av SHL 2025/26
För slutlig tippning av tabellen använde jag två olika modeller (xgboost, ovan nämnd, samt random forest) och tog genomsnittet.
📌 Noteringar:
- Färjestad och Timrå hamnar oväntat lågt jämfört med tidigare säsonger
- Örebro och Rögle BK ser starka ut enligt modellen
- HV71 och Djurgården placerar sig i bottenskiktet
📌 Slutsats
Modellen är såklart inte facit – men den ger en intressant bild av vilka faktorer som faktiskt spelar roll.
Kanske hittar du några överraskningar?
👉 Vill du utforska mer data? Gå till Mackans Hockey Hub