Copy
View this email in your browser
2017-05-28 | J++ Nyhetsbrev #63
Först två korta observationer från helgens Data Harvest-konferens i Mechelen:
  • Fler och fler ägnar sig åt algoritmgranskning, i det stora och i det lilla.
  • Och vi pratar om crowd sourcing igen, efter de senaste årens känsla av besvikelse, och på ett mycket mognare sätt än när begreppet var som mest hajpat. Kanske befinner vi oss i något slags ”slope of enlightenment”, om det nu går att tillämpa Gartners hajpcykel på redaktionella arbetsmetoder.
Vi ska återkomma med aktuella exempel på båda delarna, men i dag kommer först några saker som fångat vår uppmärksamhet sedan det senaste nyhetsbrevet:

Inspiration

Väljare är komplexa

Ett sådant här år älskar vi alla att studera samband mellan partisympatier och, tja, allt annat. Amerikanska data-/politikbloggen Cross Tab påminner på ett fiffigt sätt om att riktiga väljare, en och en, vare sig är särskilt typiska eller för den delen idémässigt konsekventa. Twitterbotten American__Voter twittrar ut en äkta väljarprofil i taget, basert på svar ur en stor amerikansk väljarundersökning. (Tipstack Richard Öhrvall)
https://twitter.com/American__Voter


Begär ut siffrorna

BuzzFeed i Tyskland gick vidare med de rätt allmänt rapporterade siffrorna om ”200 skadade poliser under G20 i Hamburg”, och begärde ut siffrorna. I korthet: Många av ”skadorna” var i själva verket poliser som sjukskrivit sig före toppmötet, och av dem som skadades på plats, var den vanligaste skadeorsaken sannolikt den egna tårgasen.
https://www.buzzfeed.com/de/marcusengert/bei-g20-protesten-weniger-polizisten-verletzt-als-gemeldet

Verktyg

Maskinlärning i din ficka

Botnik Studios matade en maskinlärningsalgoritm med Bitcoin-explainers, för att skapa den mesta (i brist på andra superlativ) explainern av dem alla (bilden ovan). Resultatet är roligt, och blev videon blev små-viral, men det vi tar med oss är att maskinlärningsalgoritmen de använde är en vi alla har tillgång till: Förslagsfunktionen i en självlärande tangbordsapp på en vanlig mobiltelefon!
ttps://www.youtube.com/watch?v=tBRWJzAjkjk


Efter Pandas: Dask (och Numba)

Låt oss lämna alla andra skillnader åt sidan för nu, och prata hastighet: Att bearbeta och analysera data i Python går mångfalt mycket snabbare än det hade gjort i Excel. Och att göra det med Pandas är mångfalt mycket snabbare än dina egna hemsnickrade Python-loopar (jaså, inte det? Hör av dig, vi har jobb åt dig!). Men Python är fortfarande Python, och förr eller senare blir datamängderna ändå för stora. Om det händer dig, och du inte vill lära sig ett nytt programmeringsspråk (eller slänga pengar på ännu större servrar på Amazon), så kolla in Dask (och Numba). Här är en introduktion:
https://towardsdatascience.com/how-i-learned-to-love-parallelized-applies-with-python-pandas-dask-and-numba-f06b0b367138


I stället för dubbla Y-axlar

Om du läser det här nyhetsbrevet är du säkert redan övertygad om alla problem som följer med att ha dubbla Y-axlar i en graf. Och ändå är det så mycket du vill berätta på en och samma gång! Lisa Charlotte Rost diskuterar fyra alternativ på Datawrapper-bloggen:
https://blog.datawrapper.de/dualaxis/

Utbildning

Lär dig visualisera!

Från Knight Center kommer ännu en gratis onlinekurs i datajournalistik, den här gången med visualisering i fokus. De utlovar visualisering i både berättar- och utforskningssyfte.
https://journalismcourses.org/DE0618.html
 

Lär ut datatvätt!

Brukar du hålla datajournalistikkurser? Här Rachael Tatman samlat smutsiga dataset som lämpar sig att öva datatvätt på, på olika nivåer.
https://makingnoiseandhearingthings.com/2018/04/19/datasets-for-data-cleaning-practice/
Varannan vecka delar vi saker som inspirerat oss eller lärt oss något i det här nyhetsbrevet.
Har du tips på saker vi borde ta upp? Mejla oss på stockholm@jplsuplus.org!
Copyright © 2018 Journalism++ Stockholm, All rights reserved.


Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

Email Marketing Powered by Mailchimp