Jsi to, co lajkuješ

Jak se těží naše osobní data

Rozruch kolem zneužití facebookových dat firmou Cambridge Analytica je jen kapkou v moři nekontrolovaného a téměř všudypřítomného vytěžování osobních dat. Soukromí už do značné míry neexistuje. Ale vadí to vůbec někomu?

Když se Barack Obama snažil obhájit svůj prezidentský mandát, jeho volební tým si uvědomil, že se jim příliš nedaří oslovovat mladší voliče. Vytvořili proto fanouškovskou facebookovou aplikaci Obama 2012. V podmínkách stálo, že aplikace získává přístup nejen k osobním údajům dotyčného sympatizanta, ale i k údajům všech jeho přátel. Nebylo na tom nic zvláštního, tehdy šlo v prostředí Facebooku o běžnou vlastnost. Aplikaci si stáhlo přes milion podporovatelů. Při průměrném počtu 190 přátel se tak Obama mohl dostat k datům 190 milionů Američanů. S trochou nadsázky se dá říct, že si stáhl celý americký Facebook. Volební tým pak získaná data porovnával s veřejnými seznamy amerických voličů, hledal nerozhodnuté nebo nevolící osoby a pak psal uživatelům aplikace, aby tyto své přátele oslovili. Obamova kampaň se posléze stala vzorem, jak v politickém marketingu využít sociální sítě. Politolog Eitan Hersh tyto taktiky popsal v knize s názvem Hacking the Electorate (Jak hacknout voliče, 2015). Řada lidí začala přemýšlet, jak by se dalo ze sociálního marketingu vyždímat ještě víc.

 

Facebook mlčí

Doktorandy psychologie z Cambridgeské univerzity v roce 2007 napadlo využít Facebook jako médium, kde by mohli najít dostatek dobrovolníků pro vyplnění psychologických testů. Jejich aplikaci myPersonality tvořil psychometrický dotazník známý jako Big Five. Ten na základě pěti charakterových vlastností (otevřenost, svědomitost, extraverze, příjemnost a neurotismus) dokázal určit typ člověka, případně predikovat jeho reakce v některých situacích. Aplikace se stala překvapivě populární a výzkumníkům se kromě obrovského množství vyplněných dotazníků otevřel i další rozměr bádaní: přístup k facebookovým profilům účastníků. Výzkum se tak začal stále více zaměřovat na vztah mezi osobnostními rysy a lajkováním. Jeden lajk nic neznamená, ale stovky lajků začínají fungovat jako svébytný a dosud neprobádaný psychologický profil. Brzy byli schopnosti s vysokou pravděpodobností určit sexuální orientaci, pohlaví, etnicitu, politickou či náboženskou příslušnost. Jejich modely se stále zpřesňovaly a dokázaly vydedukovat mnohem širší spektrum osobnostních rysů. Výzkumníkům stačilo 70 lajků, aby dotyčného znali lépe než jeho přátelé. Závěry práce publikovali na začátku roku 2013: „Komerční společnosti, vládní instituce nebo přátelé z Facebooku by mohli používat software na vyvozování osobnostních rysů, které jednotlivec vůbec neměl v úmyslu sdílet,“ uváděli David Stillwell, Thore Graepel a hlavní tahoun projektu Michal Kosinski. „Takto získané údaje mohou být snadno aplikovány na velké množství lidí bez jejich souhlasu i bez jejich vědomí,“ varovalo trio psychologů.

Výzkum neunikl Christopheru Wyliemu, třiadvacetiletému Kanaďanovi, který pracoval ve Velké Británii u firmy Strategic Communication Laboratories (SCL), respektive v její odnoži SCL Election, specializované na ovlivňování veřejného mínění a výsledků voleb. SCL, která měla zakázky od britského i amerického ministerstva obrany, pravděpodobně ovládá americký miliardář a mimořádně štědrý podporovatel republikánů Robert Mercer. Ten má zase blízko ke Steveu Bannonovi, tehdy šéfredaktorovi amerického krajně pravicového magazínu Breitbart. Ze společné schůzky vzešla myšlenka, že v nadcházejících prezidentských volbách je nutné republikánskému kandidátovi pomoci všemi dostupnými prostředky. Mercer poskytl finance na rozjezd nové firmy Cambridge Analytica, Bannon se stal jejím faktickým šéfem v pozadí a Wylie jedním z hlavních analytiků.

Nejprve se pokusili nakoupit hotová data od autora původního výzkumu Michala Kosinského, ale ten je odmítl. Cambridge Analytica (CA) proto využila služeb jeho kolegy. Aleksandr Kogan do sedmi let vyrůstal v Moskvě, poté se s rodinou přestěhoval do USA, kde se získal občanství. Vedle své profesury na Cambridgeské univerzitě získal i grant na univerzitě v Petrohradě zaměřený na výzkum sociálních sítí. V Petrohradě mimochodem sídlí společnost Internet Research Agency, označovaná jako „petrohradští trollové“ a aktuálně rovněž podezřelá z vměšování do amerických prezidentských voleb. Kogan pro CA vytvořil kopii aplikace myPersonality, která se šířila ještě rychleji než originální verze, jelikož CA účastníky testu motivovala několikadolarovou odměnou. Dotazník vyplnilo téměř tři sta tisíc uživatelů. Až do let 2014 či 2015 měly běžně facebookové aplikace přístup i k datům přátel toho, kdo si aplikaci naistaloval, proto se CA snadno dostala k přibližně 50 milionům osobních profilů. Proč byl Facebook tak lehkovážný? Provozoval přece „sociální síť“, sdílení osobních dat mělo přinést vyšší uživatelský zážitek. A taky potřeboval vydělávat – a inzerenty zajímají data.

Mercer a Bannon v prezidentských volbách sympatizovali s Tedem Cruzem, takže CA nejprve pracovala pro něj. Cruz sice celkově propadl, ale zaznamenal například úspěch ve státě Iowa, kde Donalda Trumpa porazil. Co to vypovídá o schopnostech CA? Nastoupila do kampaně příliš pozdě? Byla v zacházení s daty málo zkušená? Nebo jsou možnosti práce s daty omezené a dominantním prvkem kampaně zůstává osobnost kandidáta? Každopádně úspěch v Iowě dokázala CA přetavit ve vlastní reklamu a definovala se jako žralok v politickém marketingu, s přelomovými metodami založenými na zpracování velkého obejmu dat, psychometrických profilech a mikrocílení. Zároveň se veřejně začalo propírat, že Ted Cruz využíval pro kampaň data Facebooku získaná bez souhlasu uživatelů. Už na sklonku roku 2015 byly popsány mechanismy, jak ke sběru dat došlo, a přitom padala jména hlavních aktérů: Bannon, Mercer, Kogan. Zároveň se ale mluvilo o „Obama modelu“, takže veřejnost nebyla příliš znepokojena. Zatímco však Obama nezastíral, že jde o politickou kampaň, CA se skrývala za vědecké účely. Pokaždé však někdo odkliknul, že odevzdává osobní údaje o svých přátelích do třetích rukou, což je přinejmenším eticky sporné. V případě reprezentantů zdánlivého dobra (nebo menšího zla), máme tendenci být k témuž přečinu méně kritičtí. Facebook se tehdy ohradil, že CA data získala v rozporu s pravidly a firma je přislíbila smazat. Tím rozruch utichl. Dění před třemi lety napovídá, jak to celé dopadne i dnes.

 

Manipulace v praxi

CA po odstoupení Cruze začala pracovat pro Donalda Trumpa. Steve Bannon, považovaný za rasistu a kontroverzní postavu i v řadách republikánů, se stal šéfem jeho kampaně a po vyhraných volbách i jedním z Trumpových hlavních poradců. Skutečný rozsah práce CA během voleb a použitá taktika, jsou nyní předmětem dohadů. Na jedné straně si CA vysloužila pověst démonických manipulátorů, na straně druhé odborníci její domnělý vliv značně srážejí.

Autor iniciačního výzkumu Michal Kosinki se mezitím přesunul na univerzu ve Standfordu a občas byl napadán, že vymyslel novou psychologickou zbraň. Se svou kolegyní Sandrou Matzovou se proto rozhodli ověřit, nakolik jsou jeho teoretické závěry údajně využívané CA uplatnitelné v praxi. Zkusili tedy cílit sdělení podle osobnostních typů. Například reklama na kosmetiku měla různé podoby: extrovertním ženám se zobrazovala fotka dívky na přeplněném večírku se sloganem „Tanči, jako by se nikdo nedíval“, verze pro introvertky zase ukazovala osamocenou ženu během líčení a s textem „Krása nemusí křičet.“ Cílení na extro/introvertní ženy pak probíhalo podle již známého Kosinského modelu, jelikož dovedl definovat, jaké stránky lajkují různé typy žen. Výsledek testu nahrává CA. Reklamy přesně zacílené na osobnostní profil získaly o 40 procent více kliknutí a proběhlo o 50 procent více nákupů než u reklamy necílené.

Je ale produktový marketing stejný jako politický? Eitan Hersh, autor v úvodu zmíněné knihy Hacking the Electorate, podotýká, že osobnostní rysy sice korelují s politickými hodnotami, ale obecně jsou tyto vztahy poměrně slabé. Konzervativní postoje mohou korelovat s preferováním autoritativních vůdců, ale mnoho liberálů by také v čele státu uvítalo silného politika. Kvalita osobnostních profilů vyvozených z lajků také rychle stárne. Co lidé kdysi olajkovali, je třeba už dávno nezajímá, jen stránku umlčeli, místo aby se odhlásili. Před lety okrajové trendy se mohly stát mainstreamovými, takže vypovídací hodnota se v čase mění. Další problém nastává s průběžným vyhodnocením, se zpětnou vazbou, že správný obsah směřuje ke správným lidem. Kvalitu reklamy na produkt lze vyhodnotit podle počtu objednávek. U politického marketingu rozhodnou až volby. Určitým vodítkem jsou průzkumy preferencí, jenže do nich prosakuje celý marketingový mix.

V tuto chvíli máme příliš málo informací o tom, jaké konkrétní praktiky CA ve volbách použila. Hysterie se točí spíš kolem vyrabování 50 milionů osobních účtů, což působí jako zástupný problém. CA se už po angažmá u Cruze chlubila, že má profily všech Američanů – a to je klidně možné, jelikož v USA se dají legálně koupit prakticky jakákoli osobní data. Samotní neúspěšní prezidentští kandidáti svá data o voličích ochotně zpeněžují. Metody psychometrie a mikrocílení mohou fungovat, ale znamená to, že Trump by musel mít obří tým, který by segmentoval desítky milionů amerických voličů a snažil se jim doručit přesně cílená poselství. To se podle všeho nedělo a jasnou odpověď by mohl dát Facebook, jemuž by tak složité a masivní cílení nemohlo uniknout. Facebook však zatím mlčí.

Na nahrávkách reportérů Channel 4, kteří se vydávali za zájemce o služby CA, mluví šéf agentury Alexander Nix velmi sebejistě, ale zároveň obecně. Ve všem tom vychloubání nakonec nejkonkrétněji vyznívá využití starých osvědčených praktik – prostitutek a vydírání. Ani paralelní odhalení whistleblowera Chritophera Wylieho, jednoho ze zakladatelů CA, nejsou o nic podrobnější, protože v CA pracoval pouze rok. Jeho vystoupení namísto odpovědí vyvolává další otázky. Wylie měl už mnoho příležitostí vysvětlit, jak to v CA chodí. Proč se odhodlal až nyní? Může mít celá kauza vztah ke skutečnosti, že se Trump s Bannonem loni v srpu rozešel ve zlém? Může se jednat o vyřizování účtů v podobě napadání legitimity prezidentské volby? Ve vzduchu rovněž visí otázka, jaký vliv měla CA na hlasování o brexitu. K šíření zjednodušených emotivních tezí je Facebook téměř ideální, ani k tomu nejsou třeba psychologické profily uživatelů.

 

Čekání na katastrofu

V květnu to bude pět let, co zřejmě nejznámější whistleblower Edward Snowden vynesl na světlo informace, jak se americká NSA prostřednictvím tajného programu PRISM snaží sledovat veškerou elektronickou komunikaci. Do programu byly (respektive nadále jsou) zapojeny všechny velké technologické firmy. Microsoft, Google, Facebook ochotně vládě zpřístupnily kompletní uživatelská data. NSA má teoreticky přístup do všech počítačů s Windows, do všech cloudových úložišť, do všech telefonů. V reálném čase může sledovat elektronickou komunikaci, mířit na specifická slova a dostat se tak ke konkrétním lidem, kteří o tématu konverzují. Benevolentní protiteroristické zákony PATRIOT ACT umožňují sledovat kohokoli. NSA dokonce odposlouchávala mobil kancléřky Merkelové. Co se po tomto odhalení bezprecedentního a masivního porušování soukromí stalo? Nic. Respektive se situace ještě zhoršila. Ukázalo se, že i další státy mají podobné programy a ty, co je neměly, si je kvapem pořídily (včetně Česka).

Nešmírují nás však jen vlády, ale každý, kdo může. Operační systém Windows odesílá do centrály hromadu dat. Poskytovatelé internetu mají záznam o každé navštívené stránce a době strávené na internetu. Mobilní operátoři vědí, komu voláme, jaký máme mobil a jak často ho měníme, sledují náš přístup k internetu, podle vysílačů znají každý náš krok – jejich psychologické profily zákazníků musí být naprosto dokonalé. Mobilní aplikace kvůli neadekvátně nastaveným právům pročesávají naše telefony, anebo rovnou poslouchají. To není paranoia. Služba s názvem Alfonso poslouchala okolní rozhovory a pak doručovala přesně cílenou kontextovou reklamu. Stejně tak zvědavě naslouchají některé chytré televize nebo dětské hračky. Google má na každého z nás pěkně tučnou složku, kterou využívá při cílení reklamy. Pamatuje si každý vyhledávací dotaz, historii shlédnutých videí z YouTube, čerpá data z prohlížeče Chrome a nesmíme zapomínat, že mu patří operační systém Android, pro nějž navíc vyvíjí řadu „nepostradatelných“ aplikací. Facebook, co do objemu osobních dat, zřejmě dokáže Google o malinko předčít. Nejen díky tomu, co sami píšeme, sdílíme a lajkujeme. Téměř na každém webu je dnes tlačítko „Like“ – není třeba jej ani mačkat a Facebook stejně ví, jaké stránky navštěvujeme. Facebook rovněž ve velkém kupuje osobní data z offline zdrojů, například od úvěrových firem, a páruje je s osobními účty. Nějakých 50 milionů uniklých osobních profilů, o kterých se dnes bavíme? Směšné! V době, kdy data sbírala CA, po Facebooku kolovaly stovky tisíc dalších aplikací (kdo si dnes ještě pamatuje na populární farmářské hry od společnosti Zynga?). Kolik z nich vysávalo data? Jak již bylo řečeno, stačilo, aby si kteroukoli z aplikací nainstaloval někdo z našich přátel. Můžeme si být prakticky jistí, že všechna naše data z Facebooku zkoumá celý zástup analytických firem.

Současná situace v mnohém připomíná průmyslový rozmach a živelné dobývání přírodních zdrojů v průběhu 20. století. Kolik desítek let jsme potřebovali, abychom činnost člověka dali do souvislosti s narušeným životním prostředím a začali přijímat opatření? Měsíční krajina, otrávený vzduch i oceány, vymíraní druhů – to všechno můžeme fyzicky zakoušet, a přesto se najde dost vysoce postavených politiků, kteří devastaci přírody bagatelizují. Velká katastrofa spojená s těžením osobních dat zatím sice ještě nepřišla. Ale téměř jistě se jí dočkáme, protože online stroje a mechanismy pro ni na plné obrátky připravují podmínky.

Autor je spisovatel a scenárista.