Copy
View this email in your browser
2018-02-19 | J++ Nyhetsbrev #56

SCB, inspirerande knäck och scrapers

I denna veckas nyhetsbrev skäller vi på SCB, bjuder på en massa scrapers och tar upp några inspirerande knäck.

SCB:s DeSO-släpp - vad var det som hände?

Kommer ni ihåg i oktober, när vi i vårt nyhetsbrev peppade inför SCB:s släpp av en ny geografisk indelning? Så här skrev vi då:
”Det har varit en brist att SCB inte haft några öppna, tillgängliga data för delar av kommuner”, skriver myndigheten på sin blogg. Vi håller med. Därför blir vi också väldigt glada av att höra att myndigheten efter årsskiftet kommer släppa Demografiska statistikområden (DeSO).

Så vad är DeSO? En ny geografisk indelning på knappt 6000 områden som har mellan 700 och 2700 invånare. Tanken är att indelningen ska ersätta tidigare SAMS-områdena.

Exakt vilken data som SCB kommer släppa när DeSO-områdena läggs ut är oklart. Men i bloggen lyfter man exempelvis Hitta.se och företagets livsstilsuppgifter som ju innehåller data om medelinkomst, snittbelåning, bilar och utsläpp.
För några dagar sedan släpptes indelningen och då med tillgång till befolkningssiffror. Visst, det är alltid kul att veta hur många som bor inom en arbiträr ruta men för oss journalister (och andra) är det oftast andra variabler som är relevanta.

Så vad står på tur? Inkomstdata? Belåningssiffror? Utsläpp? Rätt svar: ingenting.
"Det kommer inte att komma några fler öppna variabler för DeSO under 2018 utan övriga variabler får man köpa av oss."
Med andra ord så ser DeSO just nu ut att inte avhjälpa SCB:s självidentifierade brist på öppna, tillgängliga data för delar av kommuner. Tvärtom verkar det vara mer rimligt att än så länge betrakta släppet som en marknadsföringsploj.

Men vem vet, SCB kanske kan leva upp till löftet? Vi är tveksamma, och till dess ber vi på J++ om ursäkt till er läsare för att vi bidrog till hypen. 

För den som ändå längtar efter vettig data nedbruten djupare än kommun, misströsta ej! Vår granne i öst har nämligen redan kommit fram till 00-talet - där kan du hitta en himla massa statistik ända ner på postnummernivå.

Inspiration och verktyg

Ojämlika företagsböter

“Tusen gånger hårdare straff - för samma brott. Det blir resultatet när miljardföretag får betala samma företagsbot som småbolag.”

Granskningen är signerad Karl Martinsson som just nu går vår Pythonkurs (en ny runda till hösten, som man kan anmäla sig till här: http://jplusplus.org/en/academy/programming-for-journalists/). Efter bara tre tillfällen hade Karl tillräcklig teknisk färdighet för att scrapa hem omsättningsdata från Ratsit, som han sedan körde mot data över företagsböter.

Storbritanniens bussnät har minskat med 8 procent
Storbritanniens bussnät minskar och minskar. En nyhet från BBC:s Shared Data Unit vars arbeten vi skrivit om tidigare. Denna gång blev det nyheter i 24 olika medier. Borde väl gå att göra i Sverige också? https://github.com/BBC-Data-Unit/buses-lost

Ny portal för upphandlingsdata
OpenTender är en ny portal som har allt du behöver och lite till rörande upphandlingar: https://opentender.eu. Om man klickar sig in till Sverige och “market analysis” så kan man t.ex. se att Ramböll Sverige AB, WSP Sverige AB och Atea Sverige AB är de som vinner flest upphandlingar i landet.

Man kan också grotta ner sig i enskilda upphandlingar och ämnesområden så det är bara att gå in och klicka fram några nyheter!

Fem verktyg för att skydda dig själv och dina källor
https://www.icij.org/blog/2018/01/five-digital-security-tools-to-protect-your-work-and-sources/

 

Scrapers från J++

Som ni kanske vet så har vi jobbat fram en första version av Statscraper (https://pypi.python.org/pypi/statscraper). Nu har vi också bunkrat upp med några mer eller mindre välfungerande scrapers. 

Och sen några demoscrapers: https://github.com/jplusplus/statscraper/tree/master/statscraper/scrapers

Copyright © 2018 Journalism++ Stockholm, All rights reserved.


Want to change how you receive these emails?
You can update your preferences or unsubscribe from this list.

Email Marketing Powered by Mailchimp