Jeg blev introduceret til daily fantasy sports (DFS) som næsten alle – hurtige brandreklamer bombarderer mig på sportsball-tv. Fantasy sport var ikke et nyt koncept for mig, jeg har været en spiller siden 1998. Jeg kan ikke engang begynde at beskrive de utallige timer, jeg brugte omhyggeligt på at forberede udkast til guider til rotisserie baseball, basketball, og min personlige favorit, fodbold.
Jeg havde det sjovt at spille i starten. En af mine foretrukne måder at tænke på DFS er, at det er som at leje dit yndlingshold for en dag. Lad os være ærlige, fodboldkampe kan bare være brutale at se, hvis du ikke hepper på dit yndlingshold. Vil du have bevis? Prøv at se nogle canadiske fodbold. Jeg garanterer, at du ikke holder i mere end 5 minutter, hvis du bor syd for Saskatchevan. Så DFS gav mig en anden måde at gå igennem søndagens med mere sjov.
Bayesian statistik er min bae
Jeg tror det var omkring midten af sidste fodboldsæson, da tingene endelig begyndte at klikke i mit hoved. Først, skandalen, hvor intern viden hjalp en FanDuel-medarbejder med at vinde en DraftKings-turnering. Jeg burde have kendt før, men jeg kan have et tykt hoved — at kende den procent, en spiller vælges, betyder noget. Hvorfor? Så du kan vælge en person, der ikke er dem; det adskiller dig fra feltet.
engang derefter læste jeg en rigtig cool hjemmeside, der skitserer gamma distributionen og dens gode pasform med fantasy fodbolddata. Det var her, tingene virkelig begyndte at klikke for mig. Så bevæbnet med en database med spillerdata siden 2003 og min trofaste R, gik jeg på arbejde.
det viser sig, at når du tager en bayesisk tilgang, hvilket betyder, at du bruger data, du har afledt fra tidligere uger, til at hjælpe med at forudsige fremtidige uger, kan du matematisk udlede pæne kurver, der hjælper med at passe til dine data og lave forudsigelser. Det er som at gå på et motionscenter: jo mere man træner sig selv, jo mere kan man lave rimelige forudsigelser om relativ fremtidig fitness.Bayesian analyse betyder at gøre antagelser baseret på tidligere resultater. Når du har et par tidligere resultater, passer de meget flotte kurver til sådanne resultater for at forudsige fremtidige resultater. Når et fremtidigt resultat har fundet sted, er det nu et tidligere resultat, og den pæne tilpasningskurve justeres for at afspejle de nye oplysninger.
tro mig, der er en masse matematik bag dette, der bare ville få dit hoved til at dreje. Måske vil jeg pege på det til et fremtidigt blogindlæg.
dog; for nu vil jeg gerne gøre en sag for Gamma Distribution som en rigtig god pasform til at forudsige konsistens i spillernes fantasy fodbold forestillinger. Hver graf og analyse nedenfor er min egen.
Aaron Rodgers
overvej sagen om Aaron Rodgers. Nedenfor er et diagram over hver Aaron Rodgers fantasy-præstation over en syv-årig periode. Søjlerne repræsenterer den procentdel af gange, han scorer et vist antal point. Den stiplede blå linje er hans Gammadistribution, der modellerer hans data.
så du kan se fra den højeste bar, han scorer 25 point i omkring otte procent af sine spil. Temmelig imponerende!
Hvad er mere imponerende, er imidlertid hans Gamma kurve analyse. Diagrammet nedenfor fremhæver Aaron Rodgers kvantiler. Rød er 0-25. kvantilområde, Gul den 25-50. kvantil, Grøn den 50-75.kvantil. Tænk på disse i form af forventninger. Gul er en gennemsnitlig ydelse, rød Under gennemsnittet, grøn over gennemsnittet.
dette sæt data betragtes nu som vores træningssæt. Vi kan bruge dette til at lave en forudsigelse af den faktiske næste præstation.
vil du gætte, hvor mange fantasy point Aaron Rodgers scorede uge 1 sidste år?
han scorede 25 point. Dette sætter ham temmelig tæt på hans træningssæt data gennemsnit og fast i det grønne område. Han havde en præstation over gennemsnittet for sig selv, men ikke helt hans bedste nogensinde. I en bayesisk model tager vi disse oplysninger, tilføjer dem til vores træningssæt og bruger dem til at forudsige uge 2.
ekstreme eksempler
bare for funsies, hvad hvis Aaron Rodgers scorede nul point i uge 1 mod Bears? Hvilket-lad os se det i øjnene – ville have været yderst usandsynligt i betragtning af at han var op imod bjørnene. Hvis vi anvender dette på vores træningsdata, anvender vi nedadgående pres på gammafordelingen og ændrer dermed hans kvantiler til hans næste uge. Væsentlige, vi “smush” ned kurven til venstre for at justere for rådden ydeevne:
Hvad med en fantastisk spil? Sig Aaron Rodgers scorer 100 point. Du gættede det, vi anvender opadgående pres på kurven til højre som følger:
hvad betyder alt dette?
det betyder, at dette er starten på, hvad der er en fantastisk forudsigelig model. Det har dog sine begrænsninger med hensyn til nøjagtighed uge til uge, hvilket er noget, jeg gerne vil skitsere i fremtidige indlæg, der kommer. Her er et smugkig på, hvor godt det bliver:
se det gennemsnit under 1? Betyder, at jeg får mere eller mindre inden for 1 point i gennemsnit af en faktisk præstationsuge til uge!
hvad synes du Steem? Ovenstående repræsenterer mit første blogindlæg i det, jeg håber at være en serie af indlæg i flere dele på min rejse gennem fantasy-prædiktive algoritmer, jeg ser frem til at lancere i år. Enhver feedback, du har til mig, ville blive værdsat!
#skrivning #blog #fantasyfootball #matematik #bayesian #analyse #steemit #Sport #nfl # statistik #steem