jeg ble introdusert til daglig fantasy sports (DFS) som omtrent alle – rask brann reklame bombardere meg på sportsball tv. Fantasy sports var ikke et nytt konsept for meg, jeg har vært en spiller siden 1998. Jeg kan ikke engang begynne å beskrive de utallige timene jeg brukte omhyggelig forberede utkast guider for rotisserie baseball, basketball, og min personlige favoritt, fotball.
jeg hadde det gøy å spille, først. En av mine favoritt måter Å tenke PÅ DFS er det er som å leie favorittlaget ditt for en dag. La oss være ærlige, fotballspill kan bare være brutale å se på hvis du ikke jubler for favorittlaget ditt. Vil du ha bevis? Prøv Å se Noen Kanadiske fotball. Jeg garanterer at du ikke varer i mer enn 5 minutter hvis du bor sør for Saskatchewan. SÅ, DFS ga meg en annen måte å gå gjennom søndagens med mer moro.
Bayesiansk statistikk er min bae
jeg antar at det var rundt midten av forrige fotball sesong da ting endelig begynte å klikke i hodet mitt. Først skandalen der innsideinformasjon hjalp En fanduel-ansatt til å vinne En DraftKings-turnering. Jeg burde ha visst før, men jeg kan ha et tykt hode-å vite prosent en spiller er plukket gjør saken. Hvorfor? Så du kan velge noen som ikke er dem; det skiller deg fra feltet.En gang etterpå leste jeg en veldig kul nettside som skisserte gammafordelingen og den passer fint sammen med fantasifotballdata. Det ER HER ting virkelig begynte å klikke for meg. Så bevæpnet med en database med spillerdata siden 2003 og min trofaste R, gikk jeg på jobb.Det viser seg at Når Du tar En Bayesiansk tilnærming, noe som betyr at du bruker data du har avledet fra tidligere uker for å bidra til å gjøre spådommer for fremtidige uker, kan du matematisk utlede fine kurver som passer til dataene dine og gjøre spådommer. Det er som å gå på treningsstudio: jo mer man trener seg, jo mer kan man gjøre rimelige spådommer om relativ fremtidig kondisjon.
Bayesiansk analyse betyr å gjøre antagelser basert på tidligere resultater. Når du har noen tidligere utfall, passer de veldig fine kurver til slike utfall for å gjøre spådommer om fremtidige utfall. Når et fremtidig utfall har funnet sted, er det nå et tidligere utfall, og den fine passende kurven blir justert for å gjenspeile den nye informasjonen.
Stol på meg, det er mye matte bak dette som bare ville gjøre hodet spinn. Kanskje jeg vil peke det til et fremtidig blogginnlegg.
Men; for nå vil jeg gjerne gjøre en sak For Gammafordelingen som en veldig fin passform for å forutsi konsistens i spillernes fantasyfotballopptredener. Hver graf og analyse nedenfor er min egen.
Aaron Rodgers
Vurder Saken Av Aaron Rodgers. Nedenfor er et diagram over Hver Aaron Rodgers fantasy ytelse over en syv års periode. Barene representerer prosentandelen av ganger han scorer et visst antall poeng. Den stiplede blå linjen er Hans Gammafordeling som modellerer hans data.så, du kan se fra den høyeste linjen, han scorer 25 poeng i omtrent åtte prosent av hans spill. Ganske imponerende!
Hva er mer imponerende, men Er Hans Gamma kurve analyse. Diagrammet nedenfor fremhever Aaron Rodgers quantiles. Rød er 0-25. quantile range, Gul den 25-50. quantile, Grønn den 50-75. quantile. Tenk på disse i form av forventninger. Gul er en gjennomsnittlig ytelse, rød under gjennomsnittet, grønn over gjennomsnittet.
dette settet med data er nå betraktet som vårt treningssett. Vi kan bruke dette til å lage en prediksjon av den faktiske neste ytelsen.Vil du gjette Hvor mange fantasy poeng Aaron Rodgers scoret Uke 1 i fjor?
han scoret 25 poeng. Dette setter ham ganske nær hans trening sett data gjennomsnitt og fast i den grønne sonen. Han hadde en over gjennomsnittlig ytelse for seg selv, men ikke helt hans beste noensinne. I En Bayesiansk modell tar vi denne informasjonen, legger den til treningssettet og bruker Den til å lage en prediksjon På Uke 2.
Ekstreme Eksempler
Bare for moro skyld, hva om Aaron Rodgers scoret null poeng I Uke 1 mot Bears? Som-la oss innse det – ville vært ekstremt usannsynlig med tanke på at han var opp mot Bjørnene. Hvis vi bruker dette på treningsdataene våre, bruker vi nedadgående trykk på gammafordelingen, og endrer dermed hans quantiles for hans neste uke. I hovedsak, vi «smush» ned kurven til venstre for å justere for råtten ytelse:
hva med et fantastisk spill? Si Aaron Rodgers scorer 100 poeng. Du gjettet det, vi bruker oppadgående trykk på kurven til høyre som følger:
Hva betyr alt dette?
Det betyr at dette er starten på det som er en fantastisk prediktiv modell. Det har sine begrensninger, men når det gjelder nøyaktighet uke til uke, noe jeg vil gjerne skissere i fremtidige innlegg som kommer. Her er en sniktitt på hvor bra det blir:
Se det gjennomsnittet under 1? Betyr at jeg får mer eller mindre innen 1 poeng i gjennomsnitt av en faktisk ytelse uke til uke!
hva synes Du Steem? Ovennevnte representerer mitt første blogginnlegg I det jeg håper å være en flersidig serie innlegg på min reise gjennom fantasy predicive algoritmer jeg gleder meg til å lansere i år. Eventuelle tilbakemeldinger du har for meg vil bli verdsatt!
# skrive # blogg #fantasyfootball #matematikk #bayesian #analyse #steemit #sport #nfl #statistikk # steem