Pojem Big Data nebo v překladu Velká Data označuje velké datové soubory, které je těžké nasbírat a ještě těžší běžnou výpočetní technikou rozumně zpracovat. Pokud se to podaří, přinášejí ale zajímavé informace, ke kterým se jinak nemáte šanci dostat.
Jako příklady tzv. Velkých Dat z komerčního sektoru se uvádí energetické, farmaceutické nebo telekomunikační společnosti. Představte si, že by všechny domácnosti byly vybaveny elektroměrem s automatickým odečtem spotřeby, a tuto spotřebu by odesílaly v pravidelných intervalech energetické společnosti. Kdyby se jí podařilo tuto záplavu dat rozumně zpracovat, mohla by získat informace o tom, v kolik hodin ráno si lidé vaří kávu, kdy večer zapínají televizi nebo jak se mění jejich návyky o víkendu.
S Velkými Daty pracují i operátoři, kteří se je snaží využít k rozpoznání chování svých zákazníků. Data jsou sbírána pomocí mobilních telefonů, které mají dnes prakticky všichni neustále u sebe. Jelikož operátoři mají informace o tom, ke kterému vysílači je každý telefon připojen, může snadno zjistit, na jakých místech se zákazník pohybuje a kde tráví svůj čas. Takto získaná data je možné využít při plánování dopravy, umisťování nové pobočky nebo k dalším účelům.
Společnost O2 například analyzovala data shromážděná ze tří nákupních center (Centrum Černý Most, Chodov a Olympia Brno) v červnu 2014. Výsledky jsou zajímavé, naproti celospolečenskému mínění je v obchodních centrech o víkendu méně lidí. V centru Chodov klesá počet návštěvníků oproti pracovním dnům o 45 %. Nejmenší rozdíly v návštěvnosti zaznamenává Olympia Brno. Nejvíce návštěvníků zaznamenávají všechny centra v pátek odpoledne. Získané údaje samozřejmě mohou posloužit třeba provozovatelům jednotlivých obchodů v plánování závozu zásob.
Další možností jak využívat Big Data je analýza dopravy. Dle dostupných dat si v Praze 93 % obyvatel zvolí na cestu do práce metro, které je nejfrekventovanější od pondělí do středy. V pátek klesá počet cestujících oproti prvním pracovním dnům téměř na polovinu a o víkendu jej užívá pouze pětina cestujících. Páteční pokles lze vysvětlit zkracováním týdne vysokoškoláků i pracujících. Mezi nejvytíženější stanice patří Dejvická, I. P. Pavlova, Anděl, Budějovická a Smíchovské nádraží. Data ukazují i doby dopravní špičky, ta ranní je mezi 7 – 9 hodinou a odpolední mezi 16 – 18 hodinou.
Ačkoliv společnost sbírá velké množství dat o velkém množství lidí, uživatelé se nemusí bát o bezpečnost, data jsou důkladně anonymizována a nelze z nich rozpoznat chování jednotlivých osob. Navíc se nejedná o nic nového, zmíněné údaje měli operátoři k dispozici odjakživa, v Česku tedy přibližně od roku 1996. Konkurenční T-Mobile se nedávno pochlubil podobným využíváním velkých dat pro sledování pohybu turistů na Šumavě.