Шта тачно има "велики подаци"?

И зашто је то велика ствар?

"Велики подаци" су нова наука о разумевању и предвиђању људског понашања проучавајући велике количине неструктурираних података. Велики подаци су познати и као "предиктивна аналитика".

Анализирајући Твиттер постове, Фацебоок феедове, еБаи претраге, ГПС трацкере и АТМ машине су неки велики примјери података. Проучавање видео записа о сигурности, података о саобраћају, временским обрасцима, доласком летова, логовима торња за мобител и пулсима срчане фреквенције су друге форме. Велики подаци представљају нередну нову науку која се мења недељно, а само неколико експерата то разуме.

Шта су неки примери великих података у редовном животу?

сцреенсхот хттп://пројецт.вниц.орг/трансит-тиме

Иако је већина великих пројеката података веома нејасна, постоје успјешни примјери великих података који утичу на свакодневни живот појединаца, компанија и влада:

Предвиђање епидемија вируса: проучавајући социо-политичке податке, временске и климатске податке, и болничке / клиничке податке, ови научници сада предвиђају епидемију денгуе грознице са унапред обавештењем од 4 недеље.

Хомициде Ватцх: овај велики профил података приказује жртве убиства, осумњичене и криминалце у Вашингтону. Оба, као начин поштовања покојника и ресурса за подизање свести за људе, овај велики пројекат података је фасцинантан.

Планирање транзитног путовања, НИЦ: ВНИЦ радио програмер Стеве Мелендез је комбиновао распоред онлине метроа са програмом за путовање кроз путовање. Његова креација омогућава Њујорчарима да кликну на своју локацију на мапи, а предвидиће се време путовања за возове и подземне жељезнице.

Ксерок је смањио губитак радне снаге: рад центра за позив је емоционално исцрпљујући. Ксерок је проучио реамс података уз помоћ професионалних аналитичара, а сада могу предвидети који центар за запошљавање највероватније остаје са компанијом најдуже.

Подршка борби против тероризма: проучавањем друштвених медија, финансијских података, резервација лета и података о безбедности, спровођење закона може предвидети и лоцирати осумњичене терористе пре него што изврше своје злочине.

Прилагођавање маркетинга бренда заснованим на прегледима друштвених медија : људи отворено и брзо деле своје мисли на интернету у пубу, ресторану или фитнес клубу. Могуће је проучавати ове милионе постова друштвених медија и пружити повратне информације компанији о томе шта људи мисле о својим услугама.

Ко користи велике податке? Шта они раде с њим?

Многе монолитне корпорације користе велике податке како би прилагодиле своје понуде и цијене како би повећале задовољство купаца.

Зашто је велики податак такав велики посао?

4 ствари чине велике податке значајним:

1. Подаци су масивни. Неће се уклапати на један чврсти диск , много мање на УСБ кључ . Обим података далеко превазилази оно што људски ум може да доживи (мислите на милијарду милијарди мегабајта, а затим размножите то за више милијарди).

2. Подаци су неуредни и неструктурирани. 50% до 80% великог рада података претвара и чисти информације, тако да се могу претраживати и сортирати. Само неколико хиљада стручњака на нашој планети у потпуности знају како чувати ове податке. Ови стручњаци такође требају веома специјализоване алате, попут ХПЕ и Хадооп, да раде свој занат. Можда ће за десет година велики експерти за податке постати десетине десетина, али су за сада веома ретка врста аналитичара, а њихов рад је и даље веома нејасан и досадан.

3. Подаци су постали роба ** која се може продати и купити. Тржиште података постоји када компаније и појединци могу купити терабате друштвених медија и друге податке. Већина података базира се на облаку, јер је превелик да се уклапа на било који појединачни хард диск. Куповина података обично подразумева претплату у којој се прикључујете на фарму облачног сервера.

** Лидери великих алата и идеја о подацима су Амазон, Гоогле, Фацебоок и Иахоо. Због тога што ове компаније послужују толико милиона људи својим онлине услугама, има смисла да они буду колекција и визионари иза велике анализе података.

4. Могућности великих података су бескрајне. Можда ће лекари једног дана предвидети срчане нападе и мождане ударце за појединце недељно пре него што се деси. Авионске и аутоматске несреће могу се смањити предиктивним анализама њихових механичких података и саобраћајних и временских обрасца. Онлине датинг може се побољшати тиме што имају велике предикторе података о томе ко су компатибилни личности за вас. Музичари могу добити увид у то што је музичка композиција најпријатељствена променљивом укусу циљне публике. Нутриционисти можда могу предвидети која комбинација куповине хране која ће купити храну ће погоршати или помоћи особним здравственим стањима. Површина је само огребана, а открића у великим подацима се дешавају сваке недеље.

Велики подаци су несрећни

Монти Ракусен / Гетти

Велики подаци су предсказива аналитика: претварање масивних неструктурних података у нешто што се може претраживати и сортирати. Ово је неуредан и хаотичан простор који захтева посебну врсту знања и стрпљења.

Узмите на пример монолитну услугу испоруке УПС-а. Програмери у УПС-у проучавају податке од својих ГПС-а и смартфона за анализу најефикаснијих начина прилагођавања загушењу саобраћаја. Подаци о ГПС-у и смартфону су велики, а нису аутоматски спремни за анализу. Ови подаци прелазе из различитих ГПС и мапа базних података, преко различитих хардверских уређаја смартфона. Аналитичари УПС-а потрошили су мјесецима претварајући све те податке у формат који се лако може претраживати и сортирати. Ипак, труд је био вредан тога. Данас, УПС је сачувао више од 8 милиона литара горива пошто су почели да користе ову велику анализу података.

Због тога што су велики подаци неуредни и захтевају толико напора да се очисте и припреми за кориштење, научници података постају надимци 'дата јаниторс' за све досадне радње које раде. -

Ипак, наука о великим подацима и предиктивној аналитици се сваке недеље побољшава. Очекујте велике податке како би постали доступни свима до 2025. године.

Зар Биг Дата не представљају интрузивну претњу приватности?

Феингерсх / Гетти

Да, ако наши закони и индивидуална заштита приватности нису пажљиво управљани, онда велики подаци упадају у личну приватност. Како стоје, Гоогле, ИоуТубе и Фацебоок већ прате ваше дневне онлине навике . Ваш паметни телефон и рачунарски живот остављају дигиталне отиске сваки дан, а софистициране компаније проучавају те отиске.

Закони око великих података се развијају. Приватност је стање бића за који сада морате преузети личну одговорност, јер више не можете очекивати то као подразумевано право.

Шта можете учинити како бисте заштитили своју приватност:

Највећи корак који можете предузети је да покријете своје свакодневне навике користећи ВПН мрежну везу . Услуга ВПН ће вам олакшати сигнал тако да ваш идентитет и локација буду макар делимично заштићени од трагова. Ово неће вас учинити 100% анонимним, али ВПН ће значајно смањити колико свијет може да поштује ваше онлине навике.

Где могу да научим више о великим подацима?

Монти Раскусен / Гетти

Велики подаци су фасцинантна ствар за људе са аналитичким умовима и љубав према технологији. Ако сте то ви, дефинитивно посетите ову страницу занимљивих пројеката великих података.