Vuoden 2016 tilastosivut

Tuomo Nieminen 2016-12-30 2 min read

Tyyppiarvo valitsee joka kuukausi yhden tilastoaiheisen sivuston esittelyyn. Vuoden lopuksi listaamme nyt kaikki vuoden 2016 tilastosivut. Hyvää uutta vuotta!


Vuosi 2016 oli ehdottomasti Data Science -vuosi. Tämä näkyi myös vahvasti Tyyppiarvon tilastosivuissa, joista suurin osa käsittelee tilastotieteen ja tietojenkäsittelyn rajapintaa. Tsekkaa alta kaikki vuoden 2016 tilastosivut!

Helmikuu

Helmikuun tilastosivu oli fivethirtyeigth.com - journalismin ja tilastotieteen pyhä yhteenliittymä. FiveThirtyEight on sivusto, joka käsittelee uutisaiheita tilastollisesta näkökulmasta. Nimi 538 tulee maan presidentinvaalien valitsijamiesten määrästä. Sivu on datajournalismin American Dream, missä tilastollisia menetelmiä käytetään luovasti.

Maaliskuu

Maaliskuun tilastosivu oli R-bloggers, R-blogosfäärin napa. R on avoimen lähdekoodin tilasto-ohjelmisto, joka on nykyään dominoivassa asemassa tilasto-ohjelmistojen kehityksen ja tilastollisen analyysin suhteen. R on niin suuri, mahtava ja suosittu, että pelkästään R-aiheisia bloggeja on sadoittain. Voidaankin puhua R-blogosfääristä.

Huhtikuu

Huhtikuun tilastosivu oli Kaggle, data sciencen koti. Kaggle on paikka, jossa on mahdollista testata taitojaan alan huippuja vastaan. Lataa datasetti ja rakenna sen perusteella ennustava malli. Parhaiten tuntematonta dataa ennustava malli voittaa ja palkintona voittajajoukkueelle on esimerkiksi rahaa tai työpaikkoja. Kaggle-yhteisöön kuuluu kymmeniä tuhansia data scientisteja yli sadasta maasta ja 200 yliopistosta.

Toukokuu

Toukokuun tilastosivu oli Cross validated, vastausten foorumi. Cross validated on tilastotieteeseen ja sen lähialoihin keskittyvä kysy & vastaa sivusto. Kysy & vastaa foorumeiden idea on yksinkertainen: kuka tahansa voi kysyä kysymyksen ja kuka tahansa voi vastata. Käyttäjät äänestävät vastauksia ylös tai alas ja parhaat vastaukset näkyvät aina ensimmäisinä. Lisäämällä web-hakuusi lisämääreen ‘cross’ tai ‘stack’, löydät hyvin todennäköisesti vastaukset tilastotiede- ja ohjelmointiongelmiisi.

Syyskuu

Kesätauon jälkeen syyskuun tilastosivu oli DataCamp, R-koodauksen koulu. DataCamp tarjoaa ilmaisia ja maksullisia ohjelmointikursseja, joiden teemana on tekemällä oppiminen. Kurssit keskittyvät data sciencen päätyökaluihin, R:ään ja Pythoniin. DataCampin ilmaisen Introduction to R -kurssin tehtäviä on tehnyt yli 230 000 opiskelijaa ympäri maailmaa.

Lokakuu

Lokakuun tilastosivu oli kokoelma datatiede-podcasteja. Datatiede ja koneoppiminen ovat kuumaa kamaa, mutta tilastotietelijällekin voi olla hankalaa pysyä mukana alan kehityksessä. Blogipostauksessaan Matt Fogel suosittelee seitsemää datatiede ja koneoppimisaiheista podcastia, jotka avaavat tieteenalan trendejä ja menetelmiä.

Marraskuu

Marraskuun tilastosivu oli GitHub, ohjelmistojen rakennusalusta. GitHub:ssa sijaitsevat esimerkiksi R-ohjelmiston pakettien lähdekoodit ja monet muut avoimen tieteen ja datan projektit. GitHub tarjoaa kätevän graafisen käyttöliittymän Linus Torvaldsin Git-versionhallintaa hyödyntäville projekteille.

Tyyppiarvo toivottaa lukijoilleen hyvää uutta vuotta. Olkoon 2017 tilastollisesti merkitsevä!