Kas vāc lielos datus un kāpēc?

2019. gada rudenī izcēlās skandāls ar Apple Card servisu: reģistrējoties tas vīriešiem un sievietēm izsniedza atšķirīgus kredītlimitus. Pat Stīvam Vozņakam nepaveicās:

Gadu iepriekš atklājās, ka Netflix platformā lietotājiem tiek rādīti dažādi plakāti un tīzeri atkarībā no viņu dzimuma, vecuma un tautības. Par to dienests tika apsūdzēts rasismā.

Visbeidzot, Marks Cukerbergs regulāri tiek aizrādīts par to, ka Facebook it kā vāc, pārdod un manipulē ar savu lietotāju datiem. Gadu gaitā viņš tika apsūdzēts un pat tiesāts par manipulācijām Amerikas vēlēšanu laikā, palīdzot Krievijas specdienestiem, kurinot naidu un radikālus uzskatus, par neatbilstošu reklāmu, nopludinot lietotāju datus, kavējot izmeklēšanu pret pedofiliem.

Facebook ieraksts no zuck

Tajā pašā laikā tiešsaistes pakalpojums Pornhub katru gadu publicē ziņojumus par to, kādu porno meklē dažādu tautību, dzimuma un vecuma cilvēki. Un tas nez kāpēc nevienu netraucē. Lai gan visi šie stāsti ir līdzīgi: katrā no tiem mēs saskaramies ar lielajiem datiem, kurus XNUMX gadsimtā sauca par “jauno eļļu”.

Kas ir lielie dati

Lielie dati — tie ir arī lielie dati (eng. Big Data) vai metadati — ir datu masīvs, kas tiek saņemts regulāri un lielos apjomos. Tie tiek savākti, apstrādāti un analizēti, kā rezultātā tiek iegūti skaidri modeļi un modeļi.

Spilgts piemērs ir dati no Lielā hadronu paātrinātāja, kas tiek piegādāts nepārtraukti un lielos daudzumos. Ar viņu palīdzību zinātnieki atrisina daudzas problēmas.

Taču lielie dati tīmeklī nav tikai statistika zinātniskiem pētījumiem. Tos var izmantot, lai izsekotu, kā uzvedas dažādu grupu un tautību lietotāji, kam viņi pievērš uzmanību un kā mijiedarbojas ar saturu. Dažreiz šim nolūkam tiek vākti dati nevis no viena avota, bet no vairākiem, salīdzinot un identificējot noteiktus modeļus.

Par to, cik liela nozīme tīklā ir lielajiem datiem, viņi sāka runāt, kad to patiešām bija daudz. 2020. gada sākumā pasaulē bija 4,5 miljardi interneta lietotāju, no kuriem 3,8 miljardi bija reģistrēti sociālajos tīklos.

Kam ir piekļuve lielajiem datiem

Saskaņā ar aptaujām vairāk nekā puse mūsu valstu uzskata, ka viņu datus tīklā izmanto trešās puses. Tajā pašā laikā daudzi sociālajos tīklos un lietojumprogrammās ievieto personisku informāciju, fotoattēlus un pat tālruņa numuru.

Kas vāc lielos datus un kāpēc?
Kas vāc lielos datus un kāpēc?
Kas vāc lielos datus un kāpēc?
Kas vāc lielos datus un kāpēc?

Tas ir jāpaskaidro šeit: pirmā persona ir pats lietotājs, kas ievieto savus datus jebkurā resursā vai lietojumprogrammā. Vienlaikus viņš piekrīt (ieliek ķeksīti līgumā) šo datu apstrādei otrā puse – tas ir, resursa īpašnieki. Trešā puse ir tie, kam resursa īpašnieki var nodot vai pārdot lietotāja datus. Bieži tas ir ierakstīts lietotāja līgumā, bet ne vienmēr.

Trešā puse ir valsts aģentūras, hakeri vai uzņēmumi, kas pērk datus komerciālos nolūkos. Pirmie var iegūt datus ar tiesas vai augstākas iestādes lēmumu. Hakeri, protams, neizmanto nekādas atļaujas – viņi vienkārši uzlauž serveros glabātās datu bāzes. Uzņēmumi (pēc likuma) var piekļūt datiem tikai tad, ja jūs pats tos esat atļāvis – atzīmējot rūtiņu zem līguma. Pretējā gadījumā tas ir nelikumīgi.

Kāpēc uzņēmumi izmanto lielos datus?

Lielie dati komerciālajā jomā ir izmantoti gadu desmitiem, tikai tie nebija tik intensīvi kā tagad. Tie ir, piemēram, ieraksti no novērošanas kamerām, dati no GPS navigatoriem vai tiešsaistes maksājumi. Tagad, attīstoties sociālajiem tīkliem, tiešsaistes pakalpojumiem un aplikācijām, to visu var savienot un iegūt vispilnīgāko priekšstatu: kur dzīvo potenciālie klienti, ko viņiem patīk skatīties, kur viņi dodas atvaļinājumā un kādas markas auto viņiem ir.

No iepriekš minētajiem piemēriem ir skaidrs, ka ar lielo datu palīdzību uzņēmumi, pirmkārt, vēlas atlasīt reklāmu mērķauditoriju. Tas ir, piedāvāt produktus, pakalpojumus vai atsevišķas iespējas tikai īstajai auditorijai un pat pielāgot produktu konkrētam lietotājam. Turklāt reklāma Facebook un citās lielajās platformās kļūst arvien dārgāka, un to rādīt visiem pēc kārtas nebūt nav izdevīgi.

Informāciju par potenciālajiem klientiem no atvērtajiem avotiem aktīvi izmanto apdrošināšanas kompānijas, privātās klīnikas un darba devēji. Pirmie, piemēram, var mainīt apdrošināšanas nosacījumus, ja redz, ka jūs bieži meklējat informāciju par noteiktām slimībām vai zālēm, un darba devēji var novērtēt, vai esat pakļauts konfliktiem un antisociālai uzvedībai.

Taču ir vēl viens būtisks uzdevums, ar kuru pēdējos gados cīnās — pietuvoties maksātspējīgākajai publikai. Tas nav tik vienkārši izdarāms, lai gan uzdevumu ievērojami atvieglo maksājumu pakalpojumi un elektroniskie čeki, izmantojot vienu OFD (fiskālo datu operatoru). Lai pietuvinātos pēc iespējas tuvāk, uzņēmumi pat cenšas izsekot un “audzināt” potenciālos klientus jau no bērnības.: izmantojot tiešsaistes spēles, interaktīvās rotaļlietas un izglītības pakalpojumus.

Kā tas darbojas?

Lielākās datu vākšanas iespējas sniedz globālas korporācijas, kurām vienlaikus pieder vairāki pakalpojumi. Facebook tagad ir vairāk nekā 2,5 miljardi aktīvo lietotāju. Tajā pašā laikā uzņēmumam pieder arī citi pakalpojumi: Instagram - vairāk nekā 1 miljards, WhatsApp - vairāk nekā 2 miljardi un citi.

Taču uzņēmumam Google ir vēl lielāka ietekme: Gmail lieto 1,5 miljardi cilvēku pasaulē, vēl 2,5 miljardus izmanto Android mobilā operētājsistēma, vairāk nekā 2 miljardus izmanto YouTube. Un tas neskaita Google meklēšanu un Google Maps lietotnes, Google Play veikalu un pārlūkprogrammu Chrome. Atliek nostiprināt savu internetbanku – un Google par jums varēs uzzināt burtiski visu. Starp citu, Yandex šajā ziņā jau ir soli priekšā, taču tas aptver tikai krievvalodīgo auditoriju.



???? Pirmkārt, uzņēmumus interesē, ko mēs ievietojam un patīkam sociālajos tīklos. Piemēram, ja banka redz, ka esat precējies un jums aktīvi patīk meitenes Instagram vai Tinder, jūs, visticamāk, apstiprināsiet patēriņa kredītu. Un hipotēka ģimenei ir zudusi.

Svarīgi ir arī tas, uz kādām reklāmām jūs klikšķinat, cik bieži un ar kādu rezultātu.

(Ti., Nākamais solis ir privātās ziņas: tajās ir daudz vairāk informācijas. Ziņojumi tika nopludināti VKontakte, Facebook, WhatsApp un citos tūlītējās ziņojumapmaiņas programmās. Pēc viņu domām, starp citu, ir viegli izsekot ģeogrāfiskajai atrašanās vietai ziņojuma nosūtīšanas brīdī. Noteikti esat ievērojuši: apspriežot ar kādu kaut kā pirkšanu vai vienkārši picas pasūtīšanu, plūsmā uzreiz parādās atbilstoša reklāma.

🚕 Lielos datus aktīvi izmanto un “nopludina” piegādes un taksometru pakalpojumi. Viņi zina, kur jūs dzīvojat un strādājat, kas jums patīk, kādi ir jūsu aptuvenie ienākumi. Uber, piemēram, parāda augstāku cenu, ja braucat mājās no bāra un acīmredzami esat pārspīlēts. Un, kad jūsu tālrunī ir daudz citu apkopotāju, viņi, gluži pretēji, piedāvās lētākus.

(Ti., Ir pakalpojumi, kas izmanto fotoattēlus un videoklipus, lai savāktu pēc iespējas vairāk informācijas. Piemēram, datora redzes bibliotēkas — Google ir tāda. Viņi skenē jūs un jūsu apkārtni, lai redzētu, kāds esat jūsu augums vai augums, kādus zīmolus jūs valkājat, ar kādu automašīnu braucat, vai jums ir bērni vai mājdzīvnieki.

(Ti., Tie, kas nodrošina SMS vārtejas bankām saviem sūtījumiem, var izsekot jūsu pirkumiem kartē – zinot pēdējos 4 ciparus un tālruņa numuru – un pēc tam pārdodiet šos datus kādam citam. Līdz ar to viss šis spams ar atlaidēm un picu kā dāvanu.

🤷️️ Visbeidzot, mēs paši nopludinām savus datus kreisajiem pakalpojumiem un lietojumprogrammām. Atcerieties to ažiotāžu ap Getcontact, kad visi labprāt ierakstīja savu tālruņa numuru, lai uzzinātu, kā to rakstījuši citi. Un tagad atrodiet viņu piekrišanu un izlasiet, kas tajā teikts par jūsu datu pārsūtīšanu (spoileris: īpašnieki tos var nodot trešajām personām pēc saviem ieskatiem):

Kas vāc lielos datus un kāpēc?

Korporācijas var veiksmīgi vākt un pat pārdot lietotāju datus gadiem ilgi, līdz nonāk tiesas prāvā – kā tas notika ar to pašu Facebook. Un tad izšķirošā loma bija uzņēmuma GDPR pārkāpumam – likumam ES, kas datu izmantošanu ierobežo daudz stingrāk nekā amerikāņu. Vēl viens nesens piemērs ir Avast antivīrusu skandāls: viens no uzņēmuma meitas pakalpojumiem apkopoja un pārdeva datus no 100 līdz 400 miljoniem lietotāju.

Bet vai tam visam ir kādas priekšrocības mums?

Cik lieli dati palīdz mums visiem?

Jā, ir arī gaišā puse.

Lielie dati palīdz notvert noziedzniekus un novērst teroristu uzbrukumus, atrast pazudušus bērnus un pasargāt viņus no briesmām.

Ar viņu palīdzību mēs saņemam foršus piedāvājumus no bankām un personīgās atlaides. Pateicoties viņiem, mēs mēs nemaksājam par daudziem pakalpojumiem un sociālajiem tīkliem, kas pelna tikai no reklāmas. Citādi Instagram vien mums izmaksātu vairākus tūkstošus dolāru mēnesī.

Facebook vien ir 2,4 miljardi aktīvo lietotāju. Tajā pašā laikā viņu peļņa 2019. gadā sasniedza 18,5 miljardus USD. Izrādās, ka uzņēmums ar reklāmas palīdzību no katra lietotāja nopelna līdz pat 7,7 USD gadā.

Visbeidzot, dažreiz tas ir vienkārši ērti: kad dienesti jau zina, kur jūs atrodaties un ko vēlaties, un jums nav pašam jāmeklē nepieciešamā informācija.

Vēl viena perspektīva lielo datu izmantošanas joma ir izglītība.

Vienā no Amerikas universitātēm Virdžīnijā tika veikts pētījums, lai apkopotu datus par tā dēvētās riska grupas studentiem. Tie ir tie, kuri slikti mācās, kavē nodarbības un grasās pamest mācības. Fakts ir tāds, ka štatos katru gadu tiek atskaitīti aptuveni 400 cilvēku. Tas ir slikti gan augstskolām, kurām tiek pazemināti reitingi un samazināts finansējums, gan pašiem studentiem: daudzi izglītībai ņem kredītus, kurus pēc atskaitīšanas vēl būs jāatmaksā. Nemaz nerunājot par zaudēto laiku un karjeras izredzēm. Ar lielo datu palīdzību iespējams laikus identificēt atpalikušos un piedāvāt tiem pasniedzēju, papildus nodarbības un citu mērķtiecīgu palīdzību.

Tas, starp citu, der arī skolām: tad sistēma paziņos skolotājiem un vecākiem – sak, bērnam problēmas, palīdzēsim kopā. Big Data arī palīdzēs saprast, kuras mācību grāmatas darbojas labāk un kuri skolotāji vieglāk izskaidro materiālu.

Vēl viens pozitīvs piemērs ir karjeras profilēšana.: tas ir, kad pusaudžiem palīdz izlemt par turpmāko profesiju. Šeit lielie dati ļauj apkopot informāciju, ko nevar iegūt, izmantojot tradicionālos testus: kā lietotājs uzvedas, kam viņš pievērš uzmanību, kā mijiedarbojas ar saturu.

Turpat ASV darbojas karjeras atbalsta programma – SC ACCELERATE. Tajā, cita starpā, tiek izmantota CareerChoice GPS tehnoloģija: viņi analizē datus par studentu būtību, viņu tieksmi uz priekšmetiem, stiprajām un vājajām pusēm. Pēc tam dati tiek izmantoti, lai palīdzētu pusaudžiem izvēlēties viņiem piemērotākās koledžas.


Abonējiet un sekojiet mums vietnē Yandex.Zen — tehnoloģija, inovācijas, ekonomika, izglītība un kopīgošana vienā kanālā.

Atstāj atbildi