Google News jako cedník informací

Matematika internetového zpravodajství

Už od devadesátých let se vedou debaty o tom, zda internetové zpravodajství nahradí klasické papírové noviny. A přestože se původní vize o „smrti papírů“ ukázaly jako přehnané, nikdo nepochybuje o významu elektronického zpravodajství.

Elektronická média mají na své straně mnoho výhod. Publikace na nich je pohodlná, prakticky okamžitá a pro čtenáře po celém světě je tato zpráva snadno dostupná. Čas, který se v papírovém světě měřil na dny a hodiny, začíná na internetu u vteřin. Článek se navíc nemusí omezovat na text, jak tomu bylo v počátku elektronických zpravodajských kanálů, sahajících až k telegrafu a semaforovým sítím 18. století. Dnešní web doslova přetéká fotografiemi, videoklipy (live přenosy i záznamy) nebo různými interaktivními „udělátky“.

Má to ale i podstatné nevýhody, zřejmé až na druhý pohled. S možností snadné publikace narostlo množství publikovaných článků, mnohdy na úkor kvality nebo důvěryhodnosti. Protože čtenář má na webu neomezené možnosti pohybu, je vystaven i většímu množství balastu, jehož kvalitu nemůže na první pohled ověřit. A rychlost bezděky nutí autory k povrchnějšímu zpracování tématu.

V současné době je už jasné, že elektronická média se prosadila a budou se prosazovat nadále. Čtenáři si zvykli na nové možnosti a vyžadují zprávy kdykoli a kdekoli. Na pomoc jim přicházejí nástroje, o kterých se ještě před dvaceti lety nesnilo ani mezinárodním tiskovým kancelářím.

Zkuste se nějakého Američana zeptat, co považuje za nejvýznamnější událost 20. století. Devět z jedenácti vám odpoví, že útok na WTC. To je také událost, na které se projevil hlad lidí z celého světa po čerstvých a objektivních informacích. Mnoho z největších zpravodajských serverů nezvládlo nápor čtenářů a nedokázalo obsloužit všechny internetové návštěvníky. Server Google tehdy zafungoval jako prostředník mezi zpravodajskými servery a čtenáři, neboť měl v paměti (Cache) uložené archivní verze článků i v době, kdy byl hledaný server vyřazený z činnosti.

Třídění i monitoring

Krišna Bharat, tehdy jednatřicetiletý zaměstnanec společnosti Google, na tento den vzpomíná i jako na den, kdy se v jeho hlavě zrodila služba monitorující a přehledně třídící všechny dostupné zdroje zpravodajství. Protože pocházel z Indie, věděl z vlastních zkušeností, jak důležitou roli hraje přístup k nezávislým informacím ověřeným z více zdrojů.

Pustil se tedy do vývoje projektu, který si dal za cíl matematicky vyřešit problém důležitosti a relevance zpravodajských článků. Nejprve se mu věnoval ve 20 % času, který mají zaměstnanci Googlu vyhrazen na vlastní nápady a projekty. Později se nápad zalíbil Eriku Schmidtovi a Bharat dostal zelenou. V dubnu roku 2002 spustil službu Google News; ta se počátkem roku 2006 zbavila nálepky „Beta“, čímž zahájila svůj ostrý provoz.

Google News není zpravodajský server, jako třeba cnn.com nebo idnes.cz. Nemá redaktory, negeneruje vlastní obsah, pouze přebírá zprávy z jiných serverů, kategorizuje je, čte (indexuje) a umožňuje v nich vyhledávat. Výsledky si čtenář může seřadit podle data nebo relevance.

Ač to na první pohled může vypadat podivně, celý běh služby Google News je plně automatizovaný. Není zde žádný editor, který rozhoduje, jakou má zpráva důležitost a kam si zasluhuje zařadit. Ostatně Google je pověstný tím, že vyspělými matematickými algoritmy řeší to, co dosud spočívalo na lidských bedrech a v mozcích. „V oněch algoritmech je bráno v potaz, na jakých zpravodajských webech se téma objevuje, kdy a jak často se podobná témata probírají,“ vysvětluje Kateřina Holcmanová, marketingová manažerka českého Googlu.

Služba Google News funguje ve světě již téměř sedm let a má za sebou mnohé úspěchy i skandály (např. kvůli údajně cenzuře v Číně nebo pro přebírání zpráv). Čtenářům poskytuje přehled o událostech a výběr z více než čtyř a půl tisíc ověřených informačních zdrojů. Úplně dole na stránce naleznete přehled jazykových verzí Google News.

Česká varianta

Od prosince je služba k dispozici i v české lokalizaci a – co je důležitější – sleduje české zpravodajské zdroje. Najdeme ji na adrese zpravy.google.cz. Je spravedlivé poznamenat, že to u nás není první služba svého druhu. Už v roce 2004 přišel Jiří Lahvička s projektem novyden.cz, a agregáty článků (pravednes.cz, headlines.cz, Jyxo Články apod.) tu byly ještě dříve.

Zprávy Google nabízejí na úvodní stránce dvě hlavní zprávy a poté sedm kategorií. U článků jsou obvykle uvedeny tři i více zdrojů, a to ve formě odkazů vedoucích na zdrojové servery. Lze si jistě představit, že mnoho lidí bude používat tuto stránku jako výchozí, pro přehled, co se právě děje.

Jediný způsob, jak Google do výběru článků zasahuje, je prostřednictvím výběru zdrojů: „Když web požádá o zařazení do databáze zdrojů v Zprávách Googlu, pracovníci Googlu se podívají na to, zda zdroj splňuje nároky na zpravodajský zdroj, tedy zda je pravidelně aktualizován, je spravován zpravodajským domem s veřejně dostupnou organizační strukturou společnosti a informace o ní jsou na stránce zveřejněny, nezveřejňuje nenávistné materiály ani pornografii, zároveň musí být stránka technicky připravena pro zařazení do Google News, tedy i do české verze Zprávy Google,” vypočítává Holcmanová. Může se podle ní tedy stát, že do článků občas „uteče“ nějaký sloupek nebo názorový útvar.

K čemu se takový agregát vlastně hodí? K tomu, co je už od začátku silnou stránkou Googlu – k vyhledávání. A to jak k tomu zpětnému, tedy k vyhledávání v již vydaných článcích, tak k vyhledávání v článcích budoucích. Z vašeho hledání si totiž můžete vytvořit RSS kanál a ten pak RSS čtečkou sledovat.

Můžeme se jen dohadovat, co na nás chystají informační technologie v budoucnu. Možná se dočkáme důkladnější symbiózy objektivního zpravodajství a blogů coby striktně názorových médií. Možná budou Zprávy Google nebo podobné agregáty schopny analyzovat naše čtenářské návyky a nabízet nám články, které nás zajímají. Bude to potřeba. Informací je dostupných čím dál větší množství a v budoucnu se nebudou cenit služby, které jich nabídnou více, ale které nám je lépe procedí…

Autor je člen redakce Technet.iDNES.cz.