Korvaus Horoskooppimerkistä
Varallisuus C Kuuluisuudet

Selvitä Yhteensopivuus Horoskooppimerkistä

Kuinka toimittajat voivat käyttää Geocommonsia interaktiivisten karttojen luomiseen

Muut

Muutama kuukausi sitten John Keefe kirjoitti Poynter.org-oppaan muototiedostojen käytöstä. Hän kirjoitti, että muototiedoston teho on kyky viitata alueisiin pisteiden sijaan.

Mutta entä jos tiedoissasi on pisteitä (esimerkiksi osoitteita) ja haluat kartoittaa alueita? Oletetaan esimerkiksi, että sinulla on osoitteita ympäristörikkomuksista ja haluat näyttää, millä kongressipiireillä on eniten rikkomuksia. Sinun on löydettävä tapa yhdistää nämä pisteet muotoihin. Tässä opetusohjelmassa selitän, kuinka se tehdään.

Otetaan esimerkkiä organisaatiosta, jossa työskentelen, Sunlight Foundationista. Meillä on sivusto nimeltä Läpinäkyvyystiedot , josta käyttäjät voivat ladata tietoja, joista osa sisältää osoitteita. Yksi tällainen tietojoukko on EPA-rikkomustiedot. Siirry Transparency Data -kohtaan, napsauta EPA-välilehteä ja etsi rikkomuksia 1. heinäkuuta 2011 ja 31. joulukuuta 2011 välisenä aikana. Läpinäkyvyystiedot palauttavat noin 1 300 tietuetta. Napsauta jättiläistä 'Lataa tiedot' -painiketta tallentaaksesi tietueet tietokoneellesi.

Kun lataamme tiedot, avaamme ne laskentataulukossa. Näet, että yksi sarakkeista sisältää rikkomuksen osoitteen. (Huomaa, että jotkin tämän sarakkeen solut sisältävät useita osoitteita, kun taas toisissa ei ole osoitteita ollenkaan. Tarkoituksemme vuoksi poistamme tietueet, joissa on useita osoitteita tai ne, joissa ei ole osoitteita. Voit viitata tähän aiempaan tarinaan, 'Kuinka toimittajat voivat käyttää Exceliä tarinoiden tietojen järjestämiseen', jos tarvitset apua tässä.)

Meidän tulisi myös erottaa osoite niiden osiin. Luon uusia sarakkeita kaupungille, osavaltiolle ja postinumerolle.

(Voit viitata johonkin aikaisemmista ohjeistani - 'Kuinka toimittajat voivat käyttää säännöllisiä lausekkeita sovittaakseen tekstijonoja' saadaksesi apua tähän. Vihje, löytöni/korvaukseni oli etsiä:

|_+_|

ja korvaa:

|_+_|

Tämä jättää joitain virheitä (kuten asuntojen numerot kaupunkikenttään), jotka korjaamme etsimällä:

|_+_|

ja korvataan seuraavalla:

|_+_|

Kun tiedot on puhdistettu, tuomme ne takaisin laskentataulukkoomme. Sitten viemme laskentataulukon .csv- tai pilkuilla erotettuna tekstitiedostona, josta saat tiedosto, joka näyttää tältä .)

Nyt, yhdistääksemme nämä osoitteet kongressipiireihin, käytämme yhtä suosikkityökaluistani: GeoCommons . Aloitamme tämän prosessin viemällä yllä olevan laskentataulukon CSV-tiedostona tai 'pilkuilla eroteltujen arvojen' tekstitiedostona. Olen lähettänyt tähän esimerkkitiedoston . Sitten lataamme CSV-tiedoston suoraan GeoCommonsiin.

Kun lataat tiedot GeoCommonsiin, noudatamme kehotteita, kunnes palvelu pyytää meitä 'auttamaan geopaikannuksessa'. Meille annetaan kaksi vaihtoehtoa. Ensinnäkin voimme liittää tai yhdistää tiedot rajatietojoukkoon. Jos valitsisimme tämän vaihtoehdon, tarvitsemme rajatiedot laskentataulukkoon. Tällaisia ​​tietoja voivat olla maakuntien nimet tai FIPS-koodit, kongressin piirien koodit, väestölaskentatraktit ja vastaavat. Meillä ei ole näitä kenttiä tiedoissamme.

Toinen vaihtoehto, 'osoitteeseen tai paikannimeen perustuva geokoodi', ottaa sijaintitiedot, kuten katuosoitteen, ja muuntaa sen pituus- ja leveysasteiksi. Tämä on se vaihtoehto, jonka haluamme valita.

Riippuen tiedostosi otsikosta, GeoCommons saattaa automaattisesti havaita jotkin sijaintikentät. Muussa tapauksessa meidän on autettava GeoCommonsia määrittämään, mitkä kentät muodostavat osoitteen. Voit tehdä tämän vierittämällä alas kohtaan 'sijaintiosoite' ja valitsemalla 'muokkaa'. Siellä valitsemme 'katuosoitteen'. Teemme samoin kaupungin, osavaltion ja postinumeron osalta. Napsauta sitten 'Jatka'. (Huomaa, GeoCommons voi geokoodata enintään 5 000 osoitetta tiedostoa kohden.) Voit myös säätää muita kenttätietotyyppejä, jos haluat tai tarvitset.

Palvelulta kestää jonkin aikaa osoitteiden purkaminen ja niiden muuttaminen leveys- ja pituuspisteiksi. Prosessin lopussa GeoCommons ilmoittaa meille, kuinka hyvin se pystyi paikantamaan osoitteet. Testissäni geokoodaus kesti noin 10 minuuttia. (Jos et halua odottaa tiedostosi geokoodaamista, voit käyttää kopiota tiedoistani, saatavilla tässä .) Tietysti voit myös käyttää muita palveluita tietojen geokoodaamiseen leveys- ja pituusasteiksi ja ladata sitten nämä kentät sisältävän CSV-tiedoston - kaikkien muiden lisäksi - GeoCommonsiin.

Seuraavaksi aiomme hyödyntää yhtä GeoCommonsin parhaista ominaisuuksista: sen kykyä analysoida tietoja. Jos siirrymme äskettäin geokoodattuihin tietojoukkoihimme, voimme käyttää näitä ominaisuuksia napsauttamalla sivun oikeassa yläkulmassa olevaa 'analysoi' -painiketta.

Tämä tuo esiin joukon vaihtoehtoja. Sinun pitäisi viettää aikaa näiden työkalujen kanssa pelaamiseen, mutta tätä opetusohjelmaa varten valitsemme toisen, 'Aggregation'. Tuloksena olevasta valintaikkunasta meidän on valittava rajajoukko. Ikkuna avautuu ja etsimme '111th Congressional Districts'. Siellä valitsemme lataamani piirit. Nämä piirit ovat muototiedostojen muodossa, mikä on vektoripohjainen menetelmä alueiden kuvaamiseen.

Olen poistanut Säilytä tyhjät rajat -kohdan valinnan, koska en halua näyttää alueita, joilla ei ole nollaa rikkomusta.

GeoCommons suorittaa nyt analyysinsä, mikä minun tapauksessani kesti noin 20 minuuttia. Tuloksena oleva tiedosto sijaitsee tässä .

Vaikka voit kartoittaa tuloksena olevan tietojoukon GeoCommonsissa, huomaan, että palvelun kartat ovat liian rajoittavia. Et esimerkiksi voi hallita täysin sitä, miten karttatyökaluvihjeissä olevat tiedot muotoillaan.

Tästä syystä haluan viedä kartan pois GeoCommonsista käyttämällä 'Lataa KML-muodossa' -toimintoa. GeoCommons-vienti KML-tiedosto sisältää kaikki tiedot sekä rajatiedot. Tämän tiedoston avulla voin kääntyä Google Fusion Tablesin puoleen, tuoda KML:n ja hallita täysin suunnittelua, varjostusta, tietoikkunaa ja paljon muuta. John Keefe käsitteli sitä jo muototiedostojen johdannossa, joten en käsittele samaa aihetta.

Vaikka en yleensä käytä Geocommonsia valmiissa kartassa, se on korvaamaton työkalu informatiivisten ja kiinnostavien karttojen luomiseen, varsinkin kun käsitellään rajoja tai alueita.

Pidä hauskaa tutkimisesta ja jaa kokemuksesi GeoCommonsista ja kartoituksesta kommenttiosiossa. Jos sinulla on muita aiheita, joita haluaisit tämän sarjan käsittelevän/käsittelevän, kerro siitä meille.

Tämä tarina on osa Poynteria Hakkerit/hakkerit sarja mukana Kuinka tehdä jotka keskittyvät siihen, mitä toimittajat voivat oppia nousevista teknologian trendeistä ja uusista teknisistä työkaluista.