Nini Nini 'Big Data'?

Na Kwa nini Ni Mzozo Mkubwa?

'Big data' ni sayansi mpya ya ufahamu na kutabiri tabia ya mwanadamu kwa kusoma kiasi kikubwa cha data isiyoboreshwa. Data kubwa pia inajulikana kama 'analytics predictive'.

Kuchambua machapisho ya Twitter, feeds za Facebook, utafutaji wa eBay, watumiaji wa GPS, na mashine za ATM ni baadhi ya mifano kubwa ya data. Kusoma video za usalama, data za trafiki, mifumo ya hali ya hewa, wageni wa ndege, kumbukumbu za simu za simu, na trackers ya kiwango cha moyo ni aina nyingine. Data kubwa ni sayansi mpya isiyosababishwa ambayo hubadilika kila wiki, na wataalamu wachache tu wanaelewa yote.

Je, ni mifano gani ya data kubwa katika maisha ya kawaida?

screenshot http://project.wnyc.org/transit-time

Ingawa miradi kubwa zaidi ya data ni wazi sana, kuna mifano mafanikio ya data kubwa inayoathiri maisha ya kila siku ya watu binafsi, makampuni, na serikali:

Kutabiri kuzuka kwa virusi: kwa kujifunza data za kisiasa na kisiasa, hali ya hewa na data ya hali ya hewa, na data ya hospitali / kliniki, wanasayansi hawa sasa wanatabiri kuzuka kwa homa ya dengue na taarifa ya mapema ya wiki 4.

Kuzingatia Uuaji: hii maelezo makubwa ya mradi wa mauaji waathirika, watuhumiwa, na wahalifu huko Washington, DC. Wote kama njia ya kumheshimu marehemu na kama rasilimali ya ufahamu kwa watu, mradi huu mkubwa wa data ni wa kuvutia.

Mipango ya usafiri wa Transit, NYC: Mwandishi wa redio wa WNYC Steve Melendez aliunganisha ratiba ya chini ya mtandao na programu ya safari ya safari. Uumbaji wake unawawezesha watu wa New York kubofya mahali pa ramani, na utabiri wa wakati wa kusafiri kwa treni na barabara kuu itaonekana.

Xerox imepungua kupoteza nguvu zao: kazi ya kituo cha wito ni kuchochea kihisia. Xerox imechunguza mikutano ya data kwa msaada wa wachambuzi wa kitaaluma, na sasa wanaweza kutabiri ambayo hifadhi ya kituo cha wito ni uwezekano wa kukaa na kampuni kwa muda mrefu zaidi.

Kusaidia ugaidi dhidi ya ugaidi: kwa kujifunza vyombo vya habari vya kijamii, rekodi za kifedha, kutoridhishwa kwa ndege, na data za usalama, utekelezaji wa sheria unaweza kutabiri na kupata watuhumiwa wa kigaidi kabla ya kufanya matendo yao mabaya.

Kurekebisha uuzaji wa bidhaa kulingana na maoni ya vyombo vya habari vya watu : watu kwa uwazi na haraka kushiriki maoni yao mtandaoni kwenye pub, mgahawa, au klabu ya fitness. Inawezekana kujifunza mamilioni haya ya machapisho ya kijamii na kutoa maoni kwa kampuni juu ya kile ambacho watu wanafikiria huduma zao.

Nani Anatumia Data Kubwa? Wanafanya Nini Nao?

Makampuni mengi ya monolithic hutumia data kubwa ili kurekebisha sadaka zao na bei ili kuongeza kuridhika kwa wateja.

Kwa nini Dhamana Kubwa Ni Mzozo Mkubwa?

Mambo 4 hufanya data kubwa kuwa muhimu:

Data ni kubwa. Haifai kwenye gari moja ngumu , chini ya fimbo ya USB . Kiasi cha data kinazidi kile ambacho akili ya mwanadamu inaweza kutambua (fikiria megabytes bilioni bilioni, halafu uiongezee kwa mabilioni zaidi).

2. data ni messy na isiyojengwa. 50% hadi 80% ya kazi kubwa ya data ni kubadilisha na kusafisha habari ili iweze kuchunguza na kugeuka. Wataalamu elfu wachache tu katika dunia yetu wanajua jinsi ya kufanya usafi huu wa data. Wataalam hawa pia wanahitaji zana maalumu sana, kama HPE na Hadoop, kufanya hila zao. Labda katika miaka 10, wataalamu wa data kubwa watakuwa dime dazeni, lakini kwa sasa, wao ni aina chache sana ya mchambuzi na kazi yao bado haijulikani sana na yenye kuchochea.

3. Data imekuwa bidhaa ** ambayo inaweza kuuzwa na kununuliwa. Maeneo ya soko huwepo ambapo makampuni na watu binafsi wanaweza kununua terabytes ya vyombo vya habari vya kijamii na data nyingine. Data nyingi ni msingi wa wingu, kwa kuwa ni kubwa mno kuingilia kwenye diski yoyote ngumu moja. Kununua data mara nyingi huhusisha ada ya usajili ambapo huziba kwenye shamba la wingu la wingu.

** Viongozi wa zana kubwa za data na mawazo ni Amazon, Google, Facebook, na Yahoo. Kwa sababu makampuni haya hutumikia mamilioni mingi ya watu na huduma zao za mtandao, inafaa kuwa watakuwa ni hatua ya kukusanya na maono ya nyuma ya uchambuzi mkubwa wa takwimu.

4. Uwezekano wa data kubwa hauna mwisho. Labda madaktari siku moja kutabiri mashambulizi ya moyo na viharusi kwa wiki kadhaa kabla ya kutokea. Migogoro ya ndege na magari inaweza kupunguzwa na uchambuzi wa utabiri wa data zao za mitambo na mifumo ya trafiki na hali ya hewa. Uhusiano wa mtandaoni unaweza kuboreshwa kwa kuwa na maelekezo makubwa ya data ya nani ambao ni sambamba zinazohusika kwako. Wataziki wanaweza kupata ufahamu juu ya utungaji wa muziki ambao unapendeza zaidi na mabadiliko ya ladha ya wasikilizaji wa lengo. Nutritionists wanaweza kuwa na uwezo wa kutabiri ambayo mchanganyiko wa vyakula kununuliwa kuhifadhi itaongeza au kusaidia hali ya matibabu ya mtu. Upeo huo umekatazwa, na uvumbuzi katika data kubwa hutokea kila wiki.

Data Big Ni Messy

Monty Rakusen / Getty

Data kubwa ni analytics ya utabiri: kugeuza data kubwa isiyoboreshwa katika kitu kinachotafutwa na chaguo. Hii ni nafasi ya fujo na ya machafuko ambayo inahitaji aina maalum ya ujuzi na uvumilivu.

Chukua mfano huduma ya utoaji UPS ya monolithic. Wachunguzi katika data ya utafiti wa UPS kutoka kwa GPS ya madereva na smartphones zao kuchambua njia bora zaidi za kukabiliana na msongamano wa trafiki. Hii data GPS na smartphone ni gargantuan, na sio moja kwa moja tayari kwa uchambuzi. Data hii inakuja kutoka kwenye orodha mbalimbali za GPS na ramani, kupitia vifaa mbalimbali vya vifaa vya smartphone. Wachambuzi wa UPS wametumia miezi kubadilisha data yote katika muundo ambao unaweza kutafanywa kwa urahisi na kutatuliwa. Jitihada imekuwa na thamani yake, ingawa. Leo, UPS imehifadhi zaidi ya galoni milioni 8 za mafuta tangu walianza kutumia uchambuzi huu wa data kubwa.

Kwa sababu data kubwa ni fujo na inahitaji jitihada nyingi za kusafisha na kuandaa kwa matumizi, wanasayansi wa data wameitwa jina la 'janitors data' kwa ajili ya kazi yote ya kuchochea wanayofanya. A

Sayansi ya data kubwa na analytical predictive ni kuboresha kila wiki, ingawa. Anatarajia data kubwa ili kupatikana kwa urahisi kwa kila mtu kwa mwaka wa 2025.

Je, si Big Data ni Tishio la Kutisha kwa faragha?

Feingersh / Getty

Ndiyo, ikiwa sheria zetu na ulinzi wa kibinafsi wa faragha hazielekezwi kwa makini, basi data kubwa huingia ndani ya faragha binafsi. Kwa kuwa inasimama, Google na YouTube na Facebook tayari hufuatilia tabia zako za kila siku mtandaoni . Smartphone yako na maisha ya kompyuta huacha majaribio ya kila siku ya kila siku, na makampuni ya kisasa yanasoma alama hizo.

Sheria zinazozunguka data kubwa zinatoka. Faragha ni hali ya kuwa ni lazima iwe sasa kuchukua jukumu la kibinafsi kwa, kwa vile huwezi tena kutarajia kuwa ni sawa na haki.

Nini unaweza kufanya ili kulinda faragha yako:

Hatua moja kubwa unaweza kuchukua ni kuvaa tabia zako za kila siku kwa kutumia uhusiano wa mtandao wa VPN . Huduma ya VPN itaipiga ishara yako ili utambulisho wako na eneo lako limefunikwa kwa wachache kutoka kwa wapiga kura. Hii haitafanya wewe asiyejulikana kwa 100%, lakini VPN itapunguza kiasi kikubwa cha ulimwengu kinachoweza kuzingatia mwenendo wako mtandaoni.

Ninawezaje kujifunza zaidi kuhusu data kubwa?

Monty Raskusen / Getty

Data kubwa ni jambo la kushangaza kwa watu wenye mawazo ya kuchunguza na upendo wa tech. Ikiwa ndivyo wewe, basi hakika tembelea ukurasa huu wa miradi kubwa ya data.