Proč se
už na webu OK2KKW neobjevují ankety, zjišťující názory čtenářů tak, jako
to bylo před několika lety?
Důvodem je zvyšující se počítačová
gramotnost ne vždy přátelských čtenářů webu OK2KKW... Přečtěte si něco
docela trefného na
toto téma:
Jak (ne)zfalšovat anketu – aneb Jak funguje
hlasování
Posted on Březen 31, 2015 by vlkp
napsal Master a JN
Maxův článek o falšování anket na Parlamentních listech měl a přiznávám,
že pro mne dost nečekaně, vysokou odezvu. Jednak co do čtenosti a hlavně
co do reakcí. Takže na tohle téma mi přišly hned dva články! Od dvou
autorů.
Tím prvním je nick Master. Abych vám ho přiblížil, jde o Vidlákova bratra.
Pokud vím, ještě nikdy se Kose nepřihodilo, aby měla z jedné rodiny dva
autory. Tedy jednou ano – když kdysi ve vlkově potomku -zajícovi, bouchly
saze a napsal článek k měnové krizi na Kypru, ale to se nepočítá, protože
to je v rodině vydavatele. :) Takže máme premieru rodinného psaní. A proto
že Vidlák je bezesporu jedna z největších autorských hvězd na Kose – ne li
vůbec ta největší, tak se rychle přesvědčíte, Master na tom v práci se
slovem není o nic hůře. :)
Druhým nováčkem na stejné téma, ale s dalšími informacemi , pro nás laiky,
na dané téma, je JN. S kterým už nějaký čas pojednáváme určité téma. Tohle
je ale k Maxově článku. Vzhledem k tématu jsme jsme se rozhodl oba
příspěvky spojit do jednoho článku.
A protože máme dva nové autory naráz, prosím sypte a sypte hvězdy! Díky.
Je to totiž potřeba. Je li opravdu tak snadné falšovat ankety, obcházet
rekapchy a jiné podobné hlídací nástroje, tak si nutně musím položit
otázku, jestli má smysl se vůbec bavit například o elektronické verzi
voleb? Doufám, že jeden nebo druhý pán se na tohle téma chytí a dostaneme
od nich k tomuhle tématu zajímavý článek.
Ale ted už Kosa patří jen Masterovi a následně JN.
Po přečtění Maxova článku o anketách jsem si uvědomil, že ne všem kosířům
je nutně jasné, jak takové ankety fungují a můžou fungovat. Musím
odmítnout Maxův trošku konspirační závěr, že anketa na parlamentních
listech byla manipulována záměrně administrátory serveru.
Aby taková anketa mohla dobře fungovat, je potřeba z pohledu provozovatele
zajistit to, aby každý uživatel mohl hlasovat pouze jednou. Na první
pohled docela jednoduchá úloha. Na pohled druhý se ovšem ukazuje, že to
zdaleka není tak jednoduché. Množina nástrojů, které totiž má provozovatel
(a také programátor) ankety k dispozici, aby zamezil dvojímu hlasování
toutéž osobou, je totiž značně omezená. Co tedy má provozovatel ankety k
dispozici?
IP adresu, ze které požadavek na příspěvek do ankety přichází
různé údaje posílané prohlížečem přispěvatele (sem bych zařadil například
tzv. User-Agent řetězec či Cookies, ale i další)
Ochranu proti robotům – tedy CAPTCHA
Nejprve bych se podíval, jak je to s tou ochranou proti robotům (děkuji
Vlkovi za inspiraci). Jeden by se mohl domnívat, že kdyby se do ankety
přidala CAPTCHA, nebude možné anketu nějak zásadně falšovat. Např. oněch
evidentních 300000 falešných hlasů v Maxově anketě přece musel udělat
robot. Toho by přece CAPTCHA odstínila ne? Odpověď ovšem není tak
jednoznačná. Jednak metody rozpoznávání obrazu (včetně CAPTCHA obrázků) se
vyvíjejí mílovými kroky. Co nebylo možné rozpoznat před rokem dnes zvládne
kde kdo. Rozpoznávání obrazu už je tak daleko, že mnohé captcha obrázky už
musejí být tak „abstraktní“, že je mnohdy nerozpozná ani člověk. Dnes se
má za to, že koncept opisování textu jako ochrana před roboty je již
překonán. Existují i novější koncepty, ale nejsou ještě tak rozšířené a
mají samozřejmě také své mouchy. Ale i kdyby snad autor ankety dokázal
udělat text naprosto čitelný pro člověka, avšak nečitelný pro jakéhokoliv
robota, pořád jsou tu ještě Indové, kteří 1000 CAPTCHA kódů rozlousknou
třeba za 2 dolary. (pro zájemce odkazuji například na tento článek:
http://www.root.cz/clanky/potrebujete-obejit-captcha-zaplatte-si-armadu-indu/)
Pravda, zfalšování ankety by potom bylo dražší, ale pořád stokrát
levnější, než platit Marata Burkharda
Na zvážení potom také je, co by případná CAPTCHA udělala s hlasováním.
Upřímně se přiznávám, že sám hlasování v anketách příliš nemám v oblibě a
jestli už mě nějaká anketa osloví a přidám do ní svůj hlas, tak jedině
proto, že to je záležitost jediného kliknutí. Dovolím si tvrdit, že mnoho
dalších uživatelů to má stejně. Přidání CAPTCHA do ankety by zásadním
způsobem snížilo počet hlasujících, čímž by se anketa stala nezajímavou.
Jaká je potom hodnota ankety pro vydavatele portálu, na kterém je anketa
provozována? V podstatě nulová. Přítomnost ankety snad může mírně zvýšit
oblibu článku či serveru – výsledky jsou ale pro provozovatele naprosto
nezajímavé. V obecnosti se mi jeví, že je pro provozovatele výhodnější mít
anketu s větším množstvím hlasujících, avšak nezabezpečenou, než
zabezpečenou anektu kde bude hlasovat pouze několik málo jedinců.
Přejděme ale nyní ke dvěma zbývajícím možnostem, jak zabezpečit anketu.
Kontrolu údajů posílaných prohlížečem odbydu větou, že tyto údaje jsou
zcela v režii potencionálního falzifikátora a není sebemenší problém tyto
údaje zfalšovat tak, že každý požadavek na hlasování bude mít zcela
odlišné údaje. Zbývá tedy IP adresa. Pro ty, kteří o ní nikdy nic
neslyšeli, IP adresa je jakási adresa počítače v Internetu. Každý počítač,
který chce komunikovat s jiným počítačem přes Internet (třeba serverem s
anketou) musí mít svojí jednoznačnou IP adresu, což jsou čtyři čísla
oddělená tečkou (např. server obsluhující parlamentní listy má IP adresu
81.0.231.107). V principu je potom hodně těžké (i když ne zcela nemožné)
IP adresu zfalšovat. Nabízí se tedy možnost dovolit hlasování z každé IP
adresy pouze jednou. Jeden počítač, jeden hlas. To ale také nebude mít
kýžený efekt. Jsou v tom dva háčky: Jednak, mnoho poskytovatelů připojení
k Internetu používá sdílené IP adresy, kdy je přes jednu IP adresu
připojeno třeba tisíc uživatelů. To by znamenalo, že hlas jednoho z tisíce
by zablokoval hlasování tisíce dalších uživatelů, kteří ale vůbec
nehlasovali. Druhou věcí je, že na černém trhu dostanete koupit IP adresy
zavirovaných počítačů pro takovéto účely doslova za hubičku.
Ještě bych zmínil, že Max zdokumentoval také úbytek hlasů v anketě v
jistém čase, který připisoval tomu, že si administrátoři uvědomili svou
chybu rychlého přírůstku hlasů. Z pohledu výše uvedeného musím trvat na
tom, že úbytek hlasů svědčí naopak o dobré práci parlamentních listů.
Znamená to, že anketa PL poctivě zaznamenává všechny údaje o hlasech a
hlasy evidentně falešné byl proto někdo schopen dodatečně smazat. To
jednodušší softwarové řešení ankety umět nebude. Nelze se přitom zlobit
ani na to, že i po smazání začaly hlasy znovu přibývat. Útočník mohl po
svém ohalení změnit strategii (třeba IP adresu). Docela určitě byly hlasy
odstraněny ručním zásahem administrátora. A ten má na starosti zajisté
mnohem více věcí než jenom kontrolovat jednu anketu na serveru. Změnu
strategie proto nemusel zaznamenat.
Co tedy říci závěrem? Anketa nejsou volby do parlamentu a rozhodně nemá
pro jejího provozovatele žádný smysl investovat velké peníze do jejího
zabezpečení. Navíc přílišné zabezpečení by nutně zkomplikovalo hlasování a
tím ubralo hlasujících, což jde proti zájmům provozovatele. Je potřeba se
smířit s tím, že ankety prostě jsou a budou zfalšovatelné a to jednoduše.
Navíc prakticky kýmkoliv, kdo na tom bude mít jenom trochu zájem. Zdaleka
nejen provozovateli anket.
Tolik Master.
A nyní na stejné téma JN:
Jak funguje hlasování
Kliknutím na odkaz se spustí Javascript (nemusí to být javascript, může se
načítat rovnou celý stránka – jsou to jen různé postupy téhož), která
ověří podle souboru obsahující hash, sezení jestli daný počítač už
nehlasoval. Pokud se domnívá, že nehlasoval nechá ho hlasovat. Hlas se
uloží do databáze a následně se započte. Při ukládání se pochopitelně
zjistí i IP adresa počítače. Soubor v počítači se jmenuje Cookies
(Sušenka). Je celkem zásadní protože to je jediná identifikace počítače,
která má jakýsi smysl. Z pohledu WEB. Viz obrázek jaké sušenky si
nastavují PL. Pokud někdo tyhle soubory smaže nebo vůbec nepoužije, systém
dost dobře není schopný v reálném čase poznat jestli už hlasoval nebo ne.
Jak funguje „hack“
Celkem prostě. Na adresu skriptu, který přijímá výsledky se pošle nějaká
(skriptem) očekávaná odpověď. Ten kdo posílá data se tváří jako že přijmul
sušenku, ale rázem jí zahodí a udělá to též znovu. Díky tomu lze
odhlasovat klidně několikrát za vteřinu. V tuhle chvíli je jediný
relevantní identifikátor počítače jeho IP adresa. Ta je jedinečná v celém
internetu. Problém je, že často se za jednou IP (kvůli jejich omezenému
počtu) skrývá i několik stovek počítačů. V důsledku toho nelze, objektivně
určit kdo švindluje a kdo ne (nejde to v reálném čase).
(poznámka OK2KKW: skutečný "hack" je
ovšem ve skutečnosti něco jiného - "probourání se" do počítače, na kterém
běží obsah, který je předmětem útoku, a to tak, že se "hackerovi" podaří
se v napadeném počítači chovat jako jeho administrátor. Ovšem neznalí
novináři tímto slovem označují často jakýkoli útok, zaměřený proti správné
činnosti počítače, na kterém běží zájmový obsah)
Jak vznikají ony náhlé noční změny
Opět je to prosté, někdy v noci si Admin všimne divného počtu odpovědí z
jedné IP adresy a navíc jedné odpovědi.Následuje ruční smazání takových
hlasování.
Chytrý „hacker“ ovšem IP adresy dovedně mění. Používaje různé počítače
nebo třeba celou síť ovládaných počítačů (BOT NET) a tak je i takováto
lidsko statistická metoda nepřesná. Slouží pouze k zredukování počtu
podvodných hlasů. Vzhledem k počtu hlasování a jejich rychlosti lze, ovšem
celou anketu vyhodnotit jako zmanipulovanou a to zcela cíleně. Někdo si
dal hodně záležet aby dopadla jedním způsobem.
Děje se to často a nejen na PL.
Článek byl převzat z
tohoto zdroje. |