Ո՞վ և ինչու է հավաքում մեծ տվյալներ:

2019 թվականի աշնանը Apple Card ծառայության հետ կապված սկանդալ է ծագել՝ գրանցվելիս այն տրամադրել է տարբեր վարկային սահմանաչափեր տղամարդկանց և կանանց համար։ Նույնիսկ Սթիվ Վոզնյակի բախտը չբերեց.

Մեկ տարի առաջ պարզվեց, որ Netflix հարթակը օգտատերերին ցուցադրում է տարբեր պաստառներ և թիզերներ՝ կախված նրանց սեռից, տարիքից և ազգությունից։ Դրա համար ծառայությանը մեղադրել են ռասիզմի մեջ։

Վերջապես, Մարկ Ցուկերբերգը պարբերաբար նկատողություն է ստանում Facebook-ի կողմից իր օգտատերերի տվյալները իբր հավաքելու, վաճառելու և շահարկելու համար։ Տարիների ընթացքում նրան մեղադրել և նույնիսկ դատել են ամերիկյան ընտրությունների ժամանակ մանիպուլյացիայի, ռուսական հատուկ ծառայություններին օգնելու, ատելություն և արմատական հայացքներ հրահրելու, անպատշաճ գովազդի, օգտատերերի տվյալների արտահոսքի, մանկապիղծների դեմ հետաքննությանը խոչընդոտելու համար։

zuck-ի ֆեյսբուքյան գրառումը

Միաժամանակ Pornhub առցանց ծառայությունը ամեն տարի հրապարակում է զեկույցներ, թե ինչպիսի պոռնո են փնտրում տարբեր ազգությունների, սեռի և տարիքի մարդիկ։ Եվ դա, չգիտես ինչու, ոչ մեկին չի անհանգստացնում։ Չնայած այս բոլոր պատմությունները նման են. նրանցից յուրաքանչյուրում գործ ունենք մեծ տվյալների հետ, որոնք XNUMX-րդ դարում կոչվում են «նոր նավթ»:

Ինչ է մեծ տվյալները

Big data – դրանք նաև մեծ տվյալներ են (eng. Big Data) կամ մետատվյալներ – տվյալների զանգված է, որը գալիս է կանոնավոր և մեծ ծավալներով: Դրանք հավաքվում, մշակվում և վերլուծվում են, արդյունքում ստացվում են հստակ մոդելներ և օրինաչափություններ:

Վառ օրինակ է Մեծ հադրոնային կոլայդերից ստացված տվյալները, որոնք անընդհատ և մեծ քանակությամբ են գալիս: Նրանց օգնությամբ գիտնականները լուծում են բազմաթիվ խնդիրներ։

Սակայն համացանցի մեծ տվյալները միայն գիտական հետազոտությունների վիճակագրություն չեն: Դրանք կարող են օգտագործվել՝ հետևելու, թե ինչպես են վարվում տարբեր խմբերի և ազգությունների օգտատերերը, ինչին են նրանք ուշադրություն դարձնում և ինչպես են փոխազդում բովանդակության հետ: Երբեմն դրա համար տվյալները հավաքվում են ոչ թե մեկ աղբյուրից, այլ մի քանիսից՝ համեմատելով և նույնականացնելով որոշակի օրինաչափություններ։

Այն մասին, թե որքան կարևոր են մեծ տվյալները ցանցում, նրանք սկսեցին խոսել, երբ դրանք իսկապես շատ էին: 2020 թվականի սկզբին աշխարհում կար 4,5 միլիարդ ինտերնետ օգտագործող, որից 3,8 միլիարդը գրանցված էր սոցիալական ցանցերում։

Ով ունի մուտք դեպի մեծ տվյալներ

Ըստ հարցումների՝ մեր երկրների կեսից ավելին կարծում է, որ ցանցում իրենց տվյալները օգտագործվում են երրորդ կողմերի կողմից։ Միևնույն ժամանակ, շատերը սոցիալական ցանցերում և հավելվածներում տեղադրում են անձնական տվյալներ, լուսանկարներ և նույնիսկ հեռախոսահամար:

Այստեղ անհրաժեշտ է բացատրել. առաջին մարդն ինքը՝ օգտատերն է, որն իր տվյալները տեղադրում է ցանկացած ռեսուրսի կամ հավելվածի վրա: Միևնույն ժամանակ, նա համաձայնում է (պայմանագրում նշան է դնում) այս տվյալների մշակմանը երկրորդ կողմը, այսինքն՝ ռեսուրսի տերերը. Երրորդ կողմը նրանք են, որոնց ռեսուրսի սեփականատերերը կարող են փոխանցել կամ վաճառել օգտվողի տվյալները. Հաճախ դա գրված է օգտագործողի պայմանագրում, բայց ոչ միշտ:

Երրորդ կողմը պետական կառույցներն են, հաքերները կամ ընկերությունները, որոնք տվյալներ են գնում առևտրային նպատակներով: Առաջինը տվյալներ կարող է ստանալ դատարանի կամ ավելի բարձր մարմնի որոշմամբ: Հաքերները, իհարկե, չեն օգտագործում որևէ թույլտվություն. նրանք պարզապես կոտրում են սերվերներում պահվող տվյալների բազաները: Ընկերությունները (օրենքով) կարող են մուտք գործել տվյալներ միայն այն դեպքում, եթե դուք ինքներդ նրանց թույլ եք տվել՝ նշելով պայմանագրի վանդակը: Հակառակ դեպքում դա անօրինական է։

Ինչու՞ են ընկերությունները օգտագործում Big Data-ը:

Առևտրային ոլորտում մեծ տվյալները օգտագործվել են տասնամյակներ շարունակ, պարզապես այն այնքան ինտենսիվ չէր, որքան հիմա: Դրանք են, օրինակ, տեսահսկման տեսախցիկների ձայնագրությունները, GPS նավիգատորների տվյալները կամ առցանց վճարումները: Այժմ սոցիալական ցանցերի, առցանց ծառայությունների և հավելվածների զարգացմամբ այս ամենը կարելի է միացնել և ստանալ ամենաամբողջական պատկերը՝ որտեղ են ապրում պոտենցիալ հաճախորդները, ինչ են սիրում դիտել, որտեղ են գնում արձակուրդ և ինչ մակնիշի մեքենա ունեն։

Վերոնշյալ օրինակներից պարզ է դառնում, որ խոշոր տվյալների օգնությամբ ընկերությունները, առաջին հերթին, ցանկանում են թիրախավորել գովազդը։ Այսինքն՝ առաջարկել ապրանքներ, ծառայություններ կամ անհատական տարբերակներ միայն ճիշտ լսարանին և նույնիսկ հարմարեցնել արտադրանքը կոնկրետ օգտագործողի համար: Բացի այդ, Facebook-ում և այլ խոշոր հարթակներում գովազդը գնալով թանկանում է, և այն անընդմեջ բոլորին ցուցադրելը բոլորովին ձեռնտու չէ։

Բաց աղբյուրներից պոտենցիալ հաճախորդների մասին տեղեկատվությունը ակտիվորեն օգտագործվում է ապահովագրական ընկերությունների, մասնավոր կլինիկաների և գործատուների կողմից: Առաջինը, օրինակ, կարող է փոխել ապահովագրության պայմանները, եթե տեսնեն, որ դուք հաճախ տեղեկություններ եք փնտրում որոշակի հիվանդությունների կամ դեղամիջոցների մասին, և գործատուները կարող են գնահատել, թե արդյոք դուք հակված եք կոնֆլիկտների և հակասոցիալական վարքագծի:

Բայց կա ևս մեկ կարևոր խնդիր, որը պայքարում է վերջին տարիներին՝ մերձենալ ամենավճարունակ լսարանի հետ։ Դա անելն այնքան էլ հեշտ չէ, թեև առաջադրանքին զգալիորեն նպաստում են վճարային ծառայությունները և էլեկտրոնային ստուգումները մեկ OFD-ի (ֆիսկալ տվյալների օպերատորի) միջոցով: Հնարավորինս մոտենալու համար ընկերությունները նույնիսկ մանկուց փորձում են հետևել և «սնուցել» պոտենցիալ հաճախորդներին:առցանց խաղերի, ինտերակտիվ խաղալիքների և կրթական ծառայությունների միջոցով:

Ինչպես է դա աշխատում?

Տվյալների հավաքագրման ամենամեծ հնարավորությունները համաշխարհային կորպորացիաներից են, որոնք միանգամից մի քանի ծառայություններ ունեն: Facebook-ն այժմ ունի ավելի քան 2,5 միլիարդ ակտիվ օգտատեր։ Միևնույն ժամանակ ընկերությանն են պատկանում նաև այլ ծառայություններ՝ Instagram-ը՝ ավելի քան 1 միլիարդ, WhatsApp-ը՝ ավելի քան 2 միլիարդ և այլն:

Սակայն Google-ն ավելի մեծ ազդեցություն ունի. Gmail-ն օգտագործում է աշխարհում 1,5 միլիարդ մարդ, ևս 2,5 միլիարդը՝ Android բջջային օպերացիոն համակարգով, ավելի քան 2 միլիարդը՝ YouTube-ի կողմից: Եվ դա չհաշված Google որոնումը և Google Maps հավելվածները, Google Play խանութը և Chrome բրաուզերը: Մնում է ամրացնել ձեր առցանց բանկը, և Google-ը կկարողանա բառացիորեն ամեն ինչ իմանալ ձեր մասին: Ի դեպ, Yandex-ն այս առումով արդեն մեկ քայլ առաջ է, բայց այն ընդգրկում է միայն ռուսալեզու լսարանը։

???? Առաջին հերթին ընկերություններին հետաքրքրում է այն, ինչ մենք հրապարակում և հավանում ենք սոցիալական ցանցերում։ Օրինակ, եթե բանկը տեսնում է, որ դուք ամուսնացած եք և ակտիվորեն հավանում եք աղջիկներին Instagram-ում կամ Tinder-ում, ապա ավելի հավանական է, որ դուք հաստատեք սպառողական վարկը։ Իսկ ընտանիքի հիփոթեքը չկա:

Կարևոր է նաև, թե ինչ գովազդի վրա եք սեղմում, որքան հաճախ և ինչ արդյունքով:

(Այսինքն Հաջորդ քայլը անձնական հաղորդագրություններն են. դրանք շատ ավելի շատ տեղեկություններ են պարունակում: Հաղորդագրությունների արտահոսք է եղել VKontakte-ում, Facebook-ում, WhatsApp-ում և այլ ակնթարթային մեսենջերներում: Նրանց խոսքով, ի դեպ, հաղորդագրությունն ուղարկելու պահին հեշտ է հետևել աշխարհագրական դիրքին։ Անշուշտ նկատել եք. երբ ինչ-որ մեկի հետ ինչ-որ բան գնելու կամ պարզապես պիցցա պատվիրելու մասին եք քննարկում, համապատասխան գովազդ անմիջապես հայտնվում է լրահոսում։

🚕 Մեծ տվյալներն ակտիվորեն օգտագործվում և «արտահոսում» են առաքման և տաքսի ծառայությունների կողմից: Նրանք գիտեն, թե որտեղ եք ապրում և աշխատում, ինչ եք սիրում, ինչ մոտավոր եկամուտ ունեք։ Uber-ը, օրինակ, ավելի բարձր գին է ցույց տալիս, եթե դուք բարից տուն եք գնում և ակնհայտորեն չափն անցել եք: Իսկ երբ հեռախոսիդ վրա լիքը այլ ագրեգատորներ ունենաս, ընդհակառակը, ավելի էժաններ կառաջարկեն։

(Այսինքն Կան ծառայություններ, որոնք օգտագործում են լուսանկարներ և տեսանյութեր՝ հնարավորինս շատ տեղեկատվություն հավաքելու համար: Օրինակ՝ համակարգչային տեսողության գրադարաններ – Google-ն ունի մեկը: Նրանք սկանավորում են ձեզ և ձեր շրջապատը՝ տեսնելու, թե ինչ չափի կամ բարձրություն ունեք, ինչ ապրանքանիշեր եք հագնում, ինչ մեքենա եք վարում, երեխաներ ունեք, թե ընտանի կենդանիներ:

(Այսինքն Նրանք, ովքեր տրամադրում են SMS դարպասներ բանկերին իրենց նամակագրության համար, կարող են հետևել ձեր գնումներին քարտով – իմանալով վերջին 4 թվանշանները և հեռախոսահամարը, այնուհետև վաճառեք այս տվյալները մեկ ուրիշին: Այստեղից էլ այս ամբողջ սպամը՝ զեղչերով և պիցցայով որպես նվեր:

🤷️️ Վերջապես, մենք ինքներս արտահոսում ենք մեր տվյալները ձախ ծառայություններին և հավելվածներին: Հիշեք Getcontact-ի շուրջ այդ աղմուկը, երբ բոլորը ուրախությամբ լրացնում էին իրենց հեռախոսահամարը՝ պարզելու, թե ինչպես է այն գրված ուրիշների կողմից: Եվ հիմա գտեք նրանց համաձայնությունը և կարդացեք, թե ինչ է ասվում ձեր տվյալների փոխանցման մասին (սփոյլեր. սեփականատերերը կարող են դրանք փոխանցել երրորդ կողմերին իրենց հայեցողությամբ).

Կորպորացիաները կարող են հաջողությամբ հավաքել և նույնիսկ վաճառել օգտատերերի տվյալները տարիներ շարունակ, մինչև գործը հասնի դատական գործի, ինչպես դա տեղի ունեցավ նույն Facebook-ի հետ: Եվ այնուհետև որոշիչ դեր խաղաց ընկերության կողմից GDPR-ի խախտումը. օրենքը ԵՄ-ում, որը սահմանափակում է տվյալների օգտագործումը շատ ավելի խիստ, քան ամերիկյանը: Մեկ այլ վերջին օրինակ է Avast հակավիրուսային սկանդալը. ընկերության դուստր ծառայություններից մեկը հավաքել և վաճառել է 100-ից 400 միլիոն օգտատերերի տվյալներ:

Բայց արդյո՞ք այս ամենը մեզ համար առավելություններ ունի։

Ինչպե՞ս են մեծ տվյալները օգնում մեզ բոլորիս:

Այո, կա նաև լուսավոր կողմ.

Մեծ տվյալները օգնում են բռնել հանցագործներին և կանխել ահաբեկչական հարձակումները, գտնել անհետացած երեխաներին և պաշտպանել նրանց վտանգից:

Նրանց օգնությամբ մենք մենք ստանում ենք հիանալի առաջարկներ բանկերից և անձնական զեղչեր. Նրանց շնորհիվ մենք մենք չենք վճարում շատ ծառայությունների և սոցիալական ցանցերի համար, որոնք վաստակում են միայն գովազդով. Հակառակ դեպքում, միայն Instagram-ը մեզ ամսական մի քանի հազար դոլար կարժենա։

Միայն Facebook-ն ունի 2,4 միլիարդ ակտիվ օգտատեր։ Միևնույն ժամանակ, նրանց շահույթը 2019 թվականին կազմել է 18,5 միլիարդ դոլար։ Պարզվում է, որ գովազդի միջոցով ընկերությունը տարեկան մինչև 7,7 դոլար է վաստակում յուրաքանչյուր օգտատերից։

Վերջապես, երբեմն դա պարզապես հարմար է. երբ ծառայություններն արդեն գիտեն, թե որտեղ ես և ինչ ես ուզում, և դու ստիպված չես ինքդ փնտրել քեզ անհրաժեշտ տեղեկատվությունը:

Մեծ տվյալների կիրառման մյուս խոստումնալից ոլորտը կրթությունն է:

Վիրջինիայի ամերիկյան համալսարաններից մեկում հետազոտություն է անցկացվել՝ այսպես կոչված ռիսկային խմբի ուսանողների վերաբերյալ տվյալների հավաքագրման նպատակով։ Սրանք նրանք են, ովքեր վատ են սովորում, դասերը բացակայում են և պատրաստվում են կիսատ թողնել: Բանն այն է, որ նահանգներում ամեն տարի մոտ 400 մարդ է պահվում։ Սա վատ է թե՛ բուհերի համար, որոնց վարկանիշն իջեցվել է և թե՛ ֆինանսավորումը, և թե՛ ուսանողների համար. շատերը կրթության համար վարկեր են վերցնում, որոնք պահումներից հետո դեռ պետք է մարվեն։ Էլ չեմ խոսում կորցրած ժամանակի ու կարիերայի հեռանկարների մասին։ Մեծ տվյալների օգնությամբ հնարավոր է ժամանակի ընթացքում բացահայտել ետ մնալը և նրանց առաջարկել դաստիարակ, լրացուցիչ դասընթացներ և այլ նպատակային օգնություն։

Սա, ի դեպ, հարմար է նաև դպրոցների համար. հետո համակարգը կտեղեկացնի ուսուցիչներին և ծնողներին. ասում են՝ երեխան խնդիրներ ունի, եկեք միասին օգնենք նրան։ Big Data-ը կօգնի նաև հասկանալ, թե որ դասագրքերն են ավելի լավ աշխատում, և որ ուսուցիչներն են ավելի հեշտ բացատրում նյութը:

Մեկ այլ դրական օրինակ է կարիերայի պրոֆիլավորումը:Սա այն դեպքում, երբ դեռահասներին օգնում են որոշել իրենց ապագա մասնագիտությունը: Այստեղ մեծ տվյալները թույլ են տալիս հավաքել տեղեկատվություն, որը հնարավոր չէ ստանալ ավանդական թեստերի միջոցով՝ ինչպես է օգտատերը վարվում, ինչի վրա է ուշադրություն դարձնում, ինչպես է փոխազդում բովանդակության հետ։

Նույն ԱՄՆ-ում գործում է կարիերայի ուղղորդման ծրագիր՝ SC ACCELERATE: Այն, ի թիվս այլ բաների, օգտագործում է CareerChoice GPS տեխնոլոգիան. նրանք վերլուծում են տվյալներ ուսանողների բնույթի, առարկաների նկատմամբ նրանց հակումների, ուժեղ և թույլ կողմերի մասին: Այնուհետև այդ տվյալները օգտագործվում են դեռահասներին օգնելու համար ընտրել իրենց համար ճիշտ քոլեջները:

Բաժանորդագրվեք և հետևեք մեզ Yandex.Zen-ում՝ տեխնոլոգիա, նորարարություն, տնտեսագիտություն, կրթություն և կիսվել մեկ ալիքով:

Ո՞վ և ինչու է հավաքում մեծ տվյալներ:

Թողնել գրառում