Как да цензурирам търсенето в Интернет Световно търсене, извличане на текст, големи данни

След като проучихте, анализирате и представите мрежа от политически блогове, е време да разбиете начина, по който се вписва обикновената LEGO компилация. Но колко устойчива е нашата структура? Разпада ли се от добре насочен удар или трябва да разглобяваме батериите с помощта на зъбите и ноктите си? Какво трябва да направи злият гном, ако не му харесва факта, че можем да намерим връзки и пътища между страници, представящи различни гледни точки? В нашия пост сравняваме две стратегии за атака на мрежата.

търсене

За да бомбардираме нашата мрежа от 747 блога и новинарски сайтове с 1195 връзки, ние внедрихме две стратегии, базирани на статия на Алберт Река, Хавоонг Йонг и Алберт Ласло Барабаси. Първата стратегия следва модел на случайни неуспехи. Тъй като грешка възниква на случаен принцип, ние също произволно избираме уебсайт и го изтриваме заедно с всичките му връзки. След това идва следващата страница, ние също изтриваме и т.н. Следвайки втората стратегия обаче, не оставяме унищожението на случайността, а търсим наистина болезнените точки на мрежата и ги атакуваме. За разлика от статията на Barabási, ние не премахнахме страниците с най-голям брой връзки (повечето връзки), а тези с най-голям PageRank. (Опитвали сме това и преди, а атаката на PageRank се оказа много, но донякъде по-ефективна, разрушителна маса.) Можем да продължим унищожаването, докато всички страници свършат, но тъй като сме на път да оцелеем разрушителна склонност, ние сме щастливи, че можем да демонтираме мрежата, като унищожим по-малко страници.