Data är inte allt – men det kan vara både kul och lärorikt att använda som stöd vid tippning.

Jag har samlat ihop en rad olika datapunkter och byggt en modell som förutspår poäng per lag i SHL 2025/26.
Det finns självklart hur många variabler som helst att välja på, men här är de jag använt i version 1:

  • points_last_year: poäng förra säsongen
  • points_2_years_ago: poäng för två säsonger sedan
  • table_pos_last_year: tabellplacering senast
  • avg_scored_last_year: snittmål framåt
  • avg_conceded_last_year: snittmål bakåt
  • is_allsvenskan_last_year: spelade laget i HA förra året?
  • is_allsvenskan_2_years_ago: spelade i HA för två år sen?
  • percent_returning_players: andel kvarvarande spelare
  • percent_returning_TP: andel poäng från föregående säsong som finns kvar
  • prev_GP_SHL: antal SHL-matcher i truppen innan säsongen
  • prev_TP_SHL: SHL-poäng i truppen innan säsongen
  • prev_GP_SHL_GK: SHL-matcher för målvakter
  • previous_seasons_coach: antal säsonger tränaren varit kvar i klubben

📈 Korrelationsanalys

En enkel start är att kolla på korrelationer.
Detta visar endast linjära samband, men ger ändå en fingervisning.
Som väntat har tidigare poäng och SHL-rutin i truppen tydlig positiv korrelation.
Negativ korrelation ses exempelvis för lag som kom från HockeyAllsvenskan.

Image

👉 Kika själv i dashboarden här -> flik säsongsstatistik

🤖 Feature Importance (XGBoost)

Nu blir det lite mer nördigt.
Eftersom världen inte är linjär behöver vi en modell som klarar mer komplexa samband. Jag har använt XGBoost, en välbeprövad modell inom prediktion.

Den låter oss se hur viktig varje variabel är för prediktionen – alltså feature importance.
Det betyder inte att variabeln är bra eller dålig, utan hur mycket modellen använt den för att förutsäga poäng.

Image

Vi kan också visualisera detta som ett kluster med:

  • Y-axel = “gain” (hur mycket prediktionen påverkas)
  • X-axel = “weight” (hur ofta variabeln används)

Image

🟨 Topp vänster (sällan men hög impact)

  • is_allsvenskan_2_years_ago
  • table_pos_last_year
    → Variabler som används sällan, men när de gör det är påverkan stark.

🟦 Kluster i mitten

  • prev_TP_SHL, avg_conceded_last_year, is_allsvenskan_last_year
    → Balancerade, stabila prediktorer med tydlig påverkan.

🟧 Botten höger (används ofta, mindre effekt)

  • points_last_year, points_2_years_ago, percent_returning_TP, percent_returning_players
    → Fungerar som stabiliserande input – modellen använder dem ofta men de skiftar inte så mycket.

⚫ Botten mitten (svaga)

  • avg_scored_last_year, previous_seasons_coach, prev_GP_SHL_GK, prev_GP_SHL
    → Variabler som generellt har låg påverkan.

🎯 Modellens tippning av SHL 2025/26

För slutlig tippning av tabellen använde jag två olika modeller (xgboost, ovan nämnd, samt random forest) och tog genomsnittet.

Image

📌 Noteringar:

  • Färjestad och Timrå hamnar oväntat lågt jämfört med tidigare säsonger
  • Örebro och Rögle BK ser starka ut enligt modellen
  • HV71 och Djurgården placerar sig i bottenskiktet

📌 Slutsats

Modellen är såklart inte facit – men den ger en intressant bild av vilka faktorer som faktiskt spelar roll.
Kanske hittar du några överraskningar?

👉 Vill du utforska mer data? Gå till Mackans Hockey Hub