Jsi to, co lajkuješ

Jak se těží naše osobní data

Rozruch kolem zneužití facebookových dat firmou Cambridge Analytica je jen kapka v moři nekontrolovaného a téměř všudypřítomného vytěžování osobních dat. Soukromí už do značné míry neexistuje. Ale vadí to vůbec někomu?

Když se Barack Obama snažil obhájit svůj prezidentský mandát, jeho volební tým vytvořil facebookovou aplikaci Obama 2012. Aplikace získávala přístup nejen k osobním údajům jednotlivých sympatizantů, ale i k údajům o jejich „přátelích“ a stáhlo si ji přes mi­­lion podporovatelů. Obamův tým se tak mohl dostat k datům asi 190 milionů Američanů. S trochou nadsázky se dá říct, že si stáhl celý americký Facebook. Řada lidí začala přemýšlet, jak by se dalo ze sociálního marketingu vyždímat ještě víc.

 

Facebook mlčí

Doktorandy psychologie z Cambridgeské univerzity v roce 2007 napadlo využít Facebook k oslovení dobrovolníků pro vyplnění psychologických testů. Jejich aplikaci myPersonality tvořil psychometrický dotazník známý jako Big Five. Ten na základě pěti charakterových vlastností (otevřenost, svědomitost, extraverze, příjemnost a neurotismus) dokázal určit typ člověka, případně predikovat jeho reakce v některých situacích. Aplikace se stala překvapivě populární a výzkumníkům, kteří získali obrovské množství vyplněných dotazníků, se otevřela další oblast bádání – facebookové profily respondentů. Výzkum se začal zaměřovat na vztah mezi osobnostními rysy a lajkováním. Jeden lajk nic neznamená, ale stovky lajků tvoří svébytný a dosud neprobádaný psychologický profil. Vědcům stačilo sedmdesát lajků, aby dotyčného znali lépe než jeho přátelé.

Výzkum neunikl Christopheru Wyliemu, jenž pracoval ve Velké Británii u firmy Strategic Communication Laboratories (SCL), specializované na ovlivňování veřejného mínění a výsledků voleb. SCL pravděpodobně ovládá americký miliardář a podporovatel republikánů Robert Mercer, který má blízko k Steveu Bannonovi, šéfredaktorovi amerického krajně pravicového internetového časopisu Breitbart. Společná schůzka vedla k závěru, že v nadcházejících prezidentských volbách je nutné republikánskému kandidátovi pomoci všemi dostupnými prostředky. Mercer poskytl finance na rozjezd nové firmy Cambridge Analytica (CA), Bannon se stal jejím faktickým šéfem v pozadí a Wylie jedním z hlavních analytiků. Nejprve se pokusili koupit data od autora původního výzkumu Michala Kosinského, ale ten je odmítl. Využili tedy služeb jeho kolegy Aleksandra Kogana, který vedle své profesury na Cambridgeské univerzitě získal i grant na univerzitě v Petrohradě zaměřený na výzkum sociálních sítí. Kogan vytvořil kopii aplikace myPersonality, která se šířila ještě rychleji než originální verze, jelikož CA účastníky testu motivovala několikadolarovou odměnou. Dotazník vyplnilo téměř tři sta tisíc uživatelů, přičemž až do let 2014 a 2015 měly facebookové aplikace běžně přístup i k datům „přátel“ toho, kdo si aplikaci naistaloval. Ve výsledku tedy šlo o asi padesát milionů osobních profilů. Proč byl Facebook tak lehkovážný? Provozoval přece „sociální síť“ a sdílení osobních dat mělo zlepšit uživatelský zážitek. A také potřeboval vydělávat a inzerenty zajímají data. Když se však Facebook ohradil, že CA získala data v rozporu s pravidly, firma je přislíbila smazat. Tím rozruch utichl.

Následně se Steve Bannon, považovaný za rasistu a kontroverzní postavu i v řadách republikánů, stal šéfem kampaně Donalda Trumpa a po volbách i jedním z jeho hlavních poradců. Skutečný rozsah i taktika jeho práce během voleb jsou nyní předmětem dohadů. Jakou roli v ní hrála CA a analýza dat? A podobá se produktový marketing tomu politickému? Eitan Hersh, autor knihy Hacking the Electorate (Jak hacknout voliče, 2015), podotýká, že osobnostní rysy sice korelují s politickými hodnotami, ale obecně jsou tyto vztahy poměrně slabé. Navíc osobnostní profily vyvozené z lajků rychle stárnou – co lidé kdysi lajkovali, je třeba už dávno nezajímá. Zatímco kvalitu reklamy na produkt lze vyhodnotit podle počtu objednávek, u politického marketingu rozhodnou až volby. Zkrátka, máme příliš málo informací o tom, jaké konkrétní praktiky CA ve volbách použila. Hysterie se točí spíš kolem vyrabování 50 milionů osobních účtů, což působí jako zástupný problém. Ostatně CA se už dříve chlubila, že má profily všech Američanů, což je klidně možné, jelikož v USA se dají legálně koupit prakticky jakákoli osobní data. Vždyť i neúspěšní prezidentští kandidáti svá data o voličích ochotně zpeněžují. Trump by ale musel mít obří tým, který by segmentoval desítky milionů amerických voličů, aby jim doručil přesně cílená poselství. To se podle všeho nedělo, ale jasnou odpověď by měl dát Facebook, jemuž by tak složité a masivní cílení nemohlo uniknout. Facebook však zatím mlčí.

 

Čekání na katastrofu

Letos v květnu to bude pět let od doby, kdy whistleblower Edward Snowden vynesl informace o tom, že se americká NSA prostřednictvím tajného programu PRISM snaží sledovat veškerou elektronickou komunikaci. Do programu jsou zapojeny všechny velké technologické firmy jako Microsoft, Google nebo Facebook. NSA má teoreticky přístup do všech počítačů s Windows, do všech cloudových úložišť, do všech telefonů. Benevolentní protiteroristické zákony umožňují sledovat kohokoli. Co se po tomto odhalení bezprecedentního a masivního porušování soukromí stalo? Nic. Situace se ještě zhoršila. Ukázalo se, že i další státy mají podobné programy a ty, co je neměly, si je pořídily (včetně Česka).

Operační systém Windows odesílá do centrály hromadu dat. Poskytovatelé internetu mají záznam o každé navštívené stránce a době strávené na internetu. Mobilní operátoři vědí, komu voláme, jaký máme mobil a jak často ho měníme, sledují náš přístup k internetu, podle vysílačů znají každý náš krok – jejich profily zákazníků musejí být dokonalé. Také Google má o každém z nás pořádnou složku dat, kterou využívá při cílení reklamy. Facebook je však – co do objemu osobních dat – zřejmě o něco napřed. Každopádně nějakých 50 milionů uniklých osobních profilů dnes nic neznamená. V době, kdy data sbírala CA, kolovaly po Facebooku stovky tisíc dalších aplikací. Můžeme si být prakticky jisti, že naše data z Facebooku zkoumá celá řada analytických firem.

Současná situace připomíná průmyslový rozmach a živelné dobývání přírodních zdrojů ve 20. století. Kolik desítek let jsme potřebovali, abychom činnost člověka dali do souvislosti s narušeným životním prostředím? Velká katastrofa spojená s těžbou osobních dat zatím ještě nepřišla. Ale téměř jistě se jí dočkáme, protože online stroje, které pro ni připravují podmínky, běží na plné obrátky.

Autor je spisovatel a scenárista.