Mikä on "Big Data"?

Ja miksi se on iso juttu?

"Suuri data" on uusi ymmärryksen ja ihmisen käyttäytymisen ennustaminen tutkimalla suuria määriä strukturoituja tietoja. Suuria tietoja kutsutaan myös "ennakoivaksi analyysiksi".

Twitter-viestejä, Facebook-syötteitä, eBay-hakuja, GPS-seurantaohjelmia ja pankkiautomaattien analyysi ovat joitain suuria esimerkkejä. Turvallisuusvideoiden, liikennetietojen, säämallien, lentojen saapumisten, matkapuhelinpornin lokeiden ja sykesuuntimien tutkiminen ovat muita muotoja. Suuri data on sotkuinen uusi tiede, joka muuttuu viikoittain, ja vain harvat asiantuntijat ymmärtävät kaiken.

Mitkä ovat esimerkkejä suurista tiedoista säännöllisessä elämässä?

kuvakaappaus http://project.wnyc.org/transit-time

Vaikka useimmat suuret tietohankkeet ovat hyvin epäselviä, on olemassa onnistuneita esimerkkejä suurista tiedoista, jotka vaikuttavat yksilöiden, yritysten ja hallitusten jokapäiväiseen elämään:

Ennustaminen viruksen taudinpurkauksista: tutkimalla sosiopoliittisia tietoja, sää- ja ilmastotietoja sekä sairaala / kliinisiä tietoja, nämä tiedemiehet ennustavat dengue-kuumotautia 4 viikkoa etukäteen.

Henkirikos katsella: tämä suuri tietohakemisprofiili murhtaa uhreja, epäilijöitä ja rikollisia Washingtonissa. Sekä tapana kunnioittaa kuolleita ja ihmisten tietoisuutta resursseina, tämä suuri tietohakemus on kiehtovaa.

Transit Travel Planning, NYC: WNYC-radio-ohjelmoija Steve Melendez yhdisti online-metron aikataulun matkareittiohjelmistoon. Hänen luomisensa ansiosta New Yorkin jäsenet napsauttavat sijaintia kartalla ja ennustetaan junien ja metron matkustusaikaa.

Xerox vähensi työvoiman menetystä: call center -työ on emotionaalisesti uupumatonta. Xerox on tutkinut tietoja uudelleen analyytikoiden avulla ja nyt he voivat ennustaa, minkä puhelinkeskuksen palkkaamat todennäköisesti pysyvät yrityksen kanssa pisin.

Terrorismin vastainen tuki: opiskelemalla sosiaalisia mediaa, taloudellisia tietoja, lennon varauksia ja turvallisuustietoja, lainvalvonta voi ennustaa ja sijoittaa terroristit epäiltyjä ennen kuin he tekevät pahaa tekojaan.

Sosiaalisen median arvosteluihin perustuvan brändimarkkinoinnin sopeuttaminen : ihmiset suorastaan ​​ja nopeasti jakavat online-ajatuksiaan pubissa, ravintolassa tai kuntosalissa. On mahdollista tutkia näitä miljoonia sosiaalisen median viestejä ja antaa yritykselle palautetta siitä, mitä ihmiset ajattelevat palveluistaan.

Kuka käyttää suuria tietoja? Mitä he tekevät sen kanssa?

Monet monoliittiset yritykset käyttävät suuria tietoja sopeuttaakseen tarjouksiaan ja hintojaan maksimoidakseen asiakastyytyväisyyden.

Miksi Big Data on niin iso asia?

4 asiaa tekee suurista tiedoista merkittäviä:

1. Tiedot ovat massiivisia. Se ei sovi yhteen kiintolevyyn , paljon vähemmän USB-muistitikkuun . Tietojen määrä ylittää selvästi sen, mitä ihmisen mieli voi nähdä (mieti miljardia miljardia megatavua ja sitten moninkertaistaa sen miljardeja).

2. Tiedot ovat sotkuisia ja rakenteettomia. 50-80% suuresta tietotyöstä muuntaa ja puhdistaa tietoja niin, että se on haettavissa ja lajittavissa. Vain muutama tuhat asiantuntijaa planeetallamme osaa täysin tämän tiedon puhdistamisen. Nämä asiantuntijat tarvitsevat myös erikoistyökaluja, kuten HPE ja Hadoop. Ehkä kymmenessä vuodessa suuret tietotaidon asiantuntijat tulevat kymmeniä dimeä, mutta nyt he ovat erittäin harvinainen analyytikko ja heidän työnsä on edelleen hyvin hämärää ja tylsiä.

3. Tietoja on tullut hyödykkeeksi **, jota voidaan myydä ja ostaa. Tiedot markkinapaikkoja olemassa, kun yritykset ja yksityishenkilöt voivat ostaa teratavuja sosiaalisen median ja muita tietoja. Suurin osa tiedoista on pilvipohjainen, koska se on liian suuri sovitettavaksi mihinkään yksittäiseen kiintolevyyn. Tietojen ostaminen edellyttää yleensä tilausmaksua, johon olet liittänyt pilvipalvelintilaan.

** Suurten tietojen työkalujen ja ideoiden johtajat ovat Amazon, Google, Facebook ja Yahoo. Koska nämä yritykset palvelevat niin monia miljoonia ihmisiä heidän online-palveluillaan, on järkevää, että he muodostavat keräyspisteen ja suuret datan analyysit.

4. Suurten tietojen mahdollisuudet ovat rajattomat. Ehkä lääkärit ennustavat jonain päivänä sydänkohtauksia ja aivohalvauksia yksilöille viikkoa ennen kuin heitä tapahtuu. Lentokone- ja auto-onnettomuuksia voidaan vähentää ennakoivalla analyysillä mekaanisista tiedoista sekä liikenne- ja säämalleista. Online dating voi parantaa, koska sinulla on suuri ennuste siitä, kuka olet yhteensopiva persoonallisuus sinulle. Muusikot saattavat saada selville, mikä musiikkikoostumus on miellyttävämpi kohdeyleisöiden muuttuville maille. Ravitsemusasiantuntijat voivat ehkä ennustaa, mikä myymälöissä ostettujen elintarvikkeiden yhdistelmä pahentaa tai auttaa henkilön sairauksia. Pinta on naarmuuntunut, ja suuret tiedot löytyvät joka viikko.

Big Data on hauska

Monty Rakusen / Getty

Suuri data on ennustava analyysi: massiivisten, strukturoimattomien tietojen muuntaminen haettavaksi ja lajittavaksi. Tämä on sotkuinen ja kaoottinen tila, joka vaatii erityistä tietämystä ja kärsivällisyyttä.

Ota esimerkiksi monoliittinen UPS-jakelupalvelu. UPS: n ohjelmoijat kirjoittavat tietoja kuljettajien GPS: stä ja älypuhelimista analysoimaan tehokkaimmat tapoja sopeutua liikenteen ruuhkautumiseen. GPS- ja älypuhelimen tiedot ovat mahtavia, eivätkä ne ole automaattisesti valmiita analysoimaan. Nämä tiedot kaadetaan useista GPS- ja karttatietokannoista erilaisten älypuhelimien laitteiden kautta. UPS-analyytikot ovat käyttäneet kuukausia muuntamalla kaikki tiedot muotoon, jota voidaan helposti etsiä ja lajitella. Vaiva on kuitenkin ollut sen arvoista. Nykyään UPS on säästänyt yli 8 miljoonaa gallonaa polttoainetta, koska ne alkoivat käyttää näitä suuria tietomäärityksiä.

Koska suuret tiedot ovat sotkuisia ja vaativat paljon vaivaa puhdistaa ja valmistautua käyttöön, tiedetieteilijät ovat ns. "Data janitors" kaikesta heidän työlästä työstään.

Suuriin tietoihin ja ennakoiviin analyyseihin liittyvä tiede on kuitenkin parantumassa joka viikko. Odottavat suuria tietoja, jotta ne pääsevät helposti kaikkien ulottuville vuoteen 2025 mennessä.

Eivätkö suuret tiedot ole intuitiivinen yksityisyyden uhka?

Feingersh / Getty

Kyllä, jos meidän lakimme ja yksittäisiä yksityisyydensuojaamme ei hallita huolellisesti, suuri tieto tunkeutuu yksityiselämään. Google, YouTube ja Facebook ovat jo seurattaneet päivittäisiä verkkotottumuksiaan . Älypuhelimesi ja tietojenkäsittelyelämänne jättävät päivittäin digitaaliset jalanjäljet, ja hienostuneet yritykset tutkivat näitä jalanjälkiä.

Suurien tietojen ympärillä olevat lait ovat muuttumassa. Yksityisyys on olotila, jonka on nyt otettava henkilökohtainen vastuu, koska et voi enää odottaa sitä oletuksena.

Mitä voit tehdä yksityisyyden suojaamiseksi:

Suurin yksittäinen vaihe, jonka voit tehdä, on vaatetella päivittäisiä tottumuksia VPN-verkkoyhteyden avulla . VPN-palvelu vaivuttaa signaaliasi niin, että henkilöllisyytesi ja sijainninsi on ainakin osittain peitetty jäljittimistä. Tämä ei tee 100% nimettömän, mutta VPN vähentää merkittävästi sitä, kuinka paljon maailma voi noudattaa online-tottumuksiaan.

Mistä saan lisätietoja suurista tiedoista?

Monty Raskusen / Getty

Suuri tieto on mielenkiintoinen asia analyyttisten mielialan ihmisille ja rakkaudesta tekniikkaan. Jos olet niin, sitten ehdottomasti käy tämän sivun mielenkiintoisten suurien tietoprojektien kautta.