YouTube воюва с вредно съдържание! Как компанията се бори да спре явлението

Автор: Богдан Унгуряну/Дата на публикуване: 09.09.2019 19:09

Платформата YouTube е в надпревара срещу часовника за премахване на вредно съдържание, независимо дали става дума за подбуждане към омраза, тероризъм, малтретиране на деца или други. В този случай технологията за машинно обучение е много важна.

YouTube елиминира вредното съдържание от самото начало, но усилията в тази посока се ускориха през последните години, главно чрез актуализиране на правилата, които общността трябва да следва, подобряване на инструкциите, въвеждане на системи за машинно обучение, разработване на екипи, които да анализира съдържанието или специалните програми в партньорство с различни организации. Само през 2018 г. YouTube направи над 30 промени в политиките, управляващи платформата.

В резултат на това през второто тримесечие на 2019 г. YouTube премахна над 4 милиона канала и 9 милиона видеоклипа за нарушаване на правилата на общността. В края на август YouTube публикува тримесечен отчет за съдържание, премахнато от платформата, който предоставя информация за обема на премахнатото съдържание, защо и кога е било изтрито.

Преди да премахнете съдържание, границата между това, което е прието и това, което е изтрито, трябва да се начертае там, където трябва да бъде. Целта е да се осигури свобода на изразяване и в същото време да се защити и подкрепи общността на YouTube. За тази цел YouTube има екип за разработване на политики на общността, който непрекъснато ги преглежда, за да се увери, че са в крак с времето, поддържа общността в безопасност и не ограничава свободата на YouTube.

В някои сложни случаи екипът за анализ може да прекара няколко месеца в разработване на ново правило. Това се прави чрез консултация с външни експерти и създатели на съдържание в YouTube, за да се види къде настоящите правила показват техните граници, какви са особеностите на различните региони на света, така че предложените промени да се прилагат сравнително глобално.

Една такава фундаментална промяна беше актуализирането на политиките за изказване на омраза. Тяхната промяна се състоя в понеделник, а новият набор от политики стартира в началото на юни 2019 г. Въздействието на новия набор от политики върху подбуждането към омраза бе забелязано през второто тримесечие на 2019 г .:

Премахнати са над 100 000 видеоклипа, 5-кратно увеличение
Броят на каналите, изтрити поради „реч на омразата“, се е увеличил 5 пъти, до над 17 000
Броят на коментарите, премахнати от YouTube, почти се удвои през второто тримесечие на 2019 г., до над 500 милиона, отчасти поради заличаването на коментари от „реч на омразата“

YouTube разчита на комбинация от хора и технологии, за да маркира съдържанието, което трябва да се анализира. В някои случаи "пръстови отпечатъци" се използват за намиране на копия на неподходящо съдържание преди гледане. За определени типове съдържание, като сексуално насилие над деца или тероризъм, YouTube допринася за база данни на съдържателната индустрия, за да увеличи шансовете този тип съдържание да бъде блокиран преди качването.

През 2017 г. YouTube разшири използването на технологията за машинно обучение при откриване на потенциално неподходящо съдържание, след което изпрати за човешки анализ. Тази технология е подходяща за откриване на модели, което помага при намирането на съдържание, което е подобно - но не съвсем същото - на друго съдържание, което вече е премахнато, дори преди да бъде видяно от потребителите. По този начин над 87% от 9-те милиона видеоклипове, премахнати през втората половина на 2019 г., първоначално са идентифицирани от автоматизираните системи на YouTube. Актуализация на системите за автоматично откриване на нежелана поща през второто тримесечие на 2019 г. доведе до 50% увеличение на броя на изтритите канали за нарушаване на правилата за спам.

При всички тези усилия за премахване на съдържание, което нарушава правилата, важно е видеоклиповете от този вид да не се гледат масово или изобщо да не се гледат, преди да бъдат премахнати. Тук критичният елемент е автоматизираната система за предупреждение, която помогна за откриване и оценка на съдържанието, преди то да бъде сигнализирано от общността. В резултат на това над 80% от съдържанието, докладвано от системите за автоматизация, беше премахнато, преди да получи единичен изглед през второто тримесечие на 2019 г.

YouTube стартира в началото на 2018 Intelligence Desk, екип, който следи новини, социални медии и потребителски доклади, за да открие нови тенденции в областта на неподходящото съдържание. Google е наел над 10 000 души, за да открива, анализира и премахва съдържание, което нарушава правилата на YouTube.