Индексна диета - какво носи и как действа GrowthUp

Повече не винаги е по-добре - понякога трябва да се разделите с нещата. Тук можете да разберете какво трябва да направите, за да вкарате само наистина добро и важно съдържание в индекса.

Това можете да очаквате в тази публикация

  • Какво е индексна диета?
  • Какви изисквания трябва да бъдат изпълнени?
  • Как трябва да продължите?

Тази статия е създадена в сътрудничество с Ванеса Остнер и Майк Шиндлер.

В момента индексната диета е на устните на всички. И това не е изненадващо - тъй като рекламата на съдържанието създава толкова много съдържание, че в един момент трябва да стане пренаситена. Толкова много съдържание е публикувано (и все още се публикува), че не всичко може да добави стойност за посетителите или търсачките.

Каква е изходната точка?

Що се отнася до съдържанието, то е като всички други реклами. Това, което започва като разумна иновация, се свежда до абсурд от факта, че все повече и повече хора скачат и искат парче от пая. И така съдържанието се превръща от крал в панацея - и качеството често пада. Дори изчисляването на това, че са намерени за всички възможни и невъзможни думи за търсене и комбинации с помощта на това съдържание, наистина е работило само в няколко случая.

Особено след като Google също обърна внимание на качеството на съдържанието с Panda and Co., този подход наистина вече не се препоръчва. Често пъти такова използване на съдържание просто води до бавна смърт в резултатите от търсенето. Страниците „много помага много“, които имат какво да кажат за всичко, са добър пример тук:

носи

Фиг. 1: Бавна смърт на сайт с масивни проблеми с тънко съдържание и почти дублирано съдържание.

Но какво можете да направите, за да се уверите, че цялото безполезно съдържание - от дублирано съдържание до текстови текстове с 2 звезди на Textbroker - не застрашава успеха ви в SERP? На първо място, трябва да се уверите, че само страниците, които са наистина важни за търсенето, са включени в индекса. Но какви биха били те?

В онлайн магазините страниците, свързани с търсенето, са началната страница, страниците с категории, страниците на подкатегориите, продуктовите страници и, ако е приложимо, страниците с теми. За издателските страници наистина са важни началната страница, категориите теми, подкатегориите, статиите, медийното съдържание (като видеоклипове или подкасти) и обширното съдържание (като PDF файлове и технически документи).

За разлика от това, в повечето случаи следните страници не са подходящи за търсене:

  • Страници с резултати от търсенето
  • Филтрирайте страници, сортиране и подобни типове страници
  • Дубликати
  • тънко съдържание
  • празни страници
  • ...

Вероятно знаете много уебсайтове, които поставят страници с резултати от търсенето или дубликати в индекса. Това показва защо индексната диета става все по-актуална - и това развитие се отразява и в програмите на съответните конференции.

Фиг. 2: Анонсирана лекция от OTTO на SEO CAMPIXX 2018.

Кога трябва да започнете индексна диета?

По същество има два основни проблема, които произтичат от много лошо съдържание:

  1. Google (и всяка друга търсачка също) трябва да обходи всички съществуващи документи, за да ги индексира.
  2. Google (и всяка друга търсачка също) трябва да анализира индексираните документи за тяхната релевантност, за да може да ги покаже в търсенето.

Така че, ако предлагате много „безполезно“ съдържание, губите важни ресурси. В крайна сметка отвличате вниманието на роботите от наистина доброто ви съдържание. Те може да не бъдат обходени и индексирани достатъчно бързо. Също така може да се случи, че масата на лошото съдържание разрежда значимостта на вашето добро съдържание в индекса.

Предлагате статия по темата „Почистване на индекса“. Това трябва да се класира според ключовата дума „корекция на индекса“. Статията е свързана чрез различни страници с теми и по този начин е достъпна чрез параметризирани URL адреси:

  • де/индекс почистване
  • де/корекция на индекса? source = company-page-a
  • настройка de/index? source = фирмена страница-b
  • настройка de/index? source = фирмена страница-c
  • настройка de/index? source = фирмена страница-d

Въпросът сега е: кой от тези пет документа е правилен и важен? Защото всъщност имате пет статии с идентично съдържание. Сега, ако Google не може да реши версията, машината ще избере различно съдържание. Би било много по-добре, ако имате наистина силен документ.

Как можете да идентифицирате „излишък“?

И така, как можете да успеете да идентифицирате излишните страници? Е, най-добре е да направите това в няколко стъпки.

1-ва стъпка: Заявка за сайта

За първоначален преглед можете да направите заявка за сайт в Google. Или със „сайт: домейн“, или със „сайт: тема“. Но бъдете внимателни: Заявката за сайт е само приблизителна и не предоставя 100% надеждна представа за действителния брой индексирани страници.

Фиг. 3: Заявката за сайт на немската Уикипедия извежда на преден план около 4 милиона индексирани документи.

Фиг. 4: Заявката в сайта на германската Уикипедия за „Ангела Меркел“ връща около 31 индексирани документа.

Фиг. 5: В търсенето с Google на „Ангела Меркел“ Уикипедия се класира наистина добре.

Този пример, разбира се, е малко конструиран за момента, тъй като Wikipedia не само се класира добре поради вида на индексирането. Сайтът освен това има и бонус за високо доверие. Следващият пример би бил по-близо до реалността.

Фиг. 6: Conrad.de има около 421 000 документа в индекса.

Фиг. 7: От тях около 258 се занимават с темата „Всичко в едно компютър“, при условие че всички заглавия са добре поддържани. Това са продуктови страници, които могат да се класират добре за комбинацията тип марка.

Фиг. 8: Три документа използват множествено число. Освен всичко друго, това е страница с категории, която е идеална за класиране при по-общи заявки.

Стъпка 2: Поглед отблизо на представянето

Преди всичко трябва да анализирате видимостта си. Не само за целия домейн, но и на ниво директория. Анализира индексираните URL адреси на това ниво и ги сравнява с класираните URL адреси. Можете също така да разгледате данните за трафика, за да видите кои страници се посещават редовно.

3-та стъпка: Идентифициране на класически "жертви"

Сега е време да се задълбочите в уебсайта си. Оставете да обходите страницата и използвайте SEO инструменти за търсене на следните показатели, които показват отхвърляния:

  • дублирани заглавия на страници
  • дублирани описания
  • дублирани заглавия H1
  • Дублиране или колебания в класирането (можете да ги намерите например със Serplorer или чрез собствения ви износ на Search Console)
  • Има ли URL адреси, които се редуват за определени класации? Същите ли са по съдържание?
  • Проверете URL адресите на параметрите
  • Проверете странирането
  • Проверете филтъра (индексирани ли са функциите и имате ли нужда от получените страници в индекса?)
  • Блогове (страници с маркери, архивни страници, страници с категории и тяхното разбиране на страници)

4-та стъпка: Анализ на регистрационния файл

Анализът на регистрационния файл е истинска експертна тема. По времето преди Google Analytics това беше методът на избор за анализ на трафика. С течение на времето обаче той просто стана твърде сложен в сравнение. Благодарение на новите инструменти и мощния хардуер, той отново е в тенденция от известно време. Обикновено представлява особен интерес да се отговорят на следните въпроси за по-големи страници:

  • Кои страници обхожда ботът на Google?
  • Колко често обхожда тези страници?
  • Всички страни са важни?
  • Има ли "трупове" там?
  • Ботът "се губи" (напр. При странички)?

Справяне с излишъка

Ако сега сте идентифицирали страниците, които искате да премахнете от индекса, естествено възниква въпросът как можете да направите това. На първо място, не бива да използвате безразсъдно маркера noindex. Защото това премахва само симптома, а не действителния проблем.

Консолидирайте съдържанието

Консолидирането на съдържанието е класическият метод за издатели и списания. Чрез вътрешно маркиране и анализ на заглавия и заглавия вие идентифицирате подобно и много подобно съдържание и ги обединявате - например на страница за преглед. В най-добрия случай използвате възможността и ревизирате съдържанието отново директно.

Как можете да направите това е илюстрирано от следния пример:

Фиг. 9: Gutefrage.net предлага почти 50 000 документа на тема „Бременна ли съм“.

Фиг. 10: Има само около 1390 резултата по същата тема на Erdbeerlounge.de.

Фиг. 11: В SERPs Erdbeerlounge постига значително по-добри резултати със страницата с теми, отколкото Gutefrage.net.

Фиг. 12: За сравнение, ягодният салон е много по-стабилен.

Когато консолидирате съдържанието си обаче, никога не трябва да забравяте четирите централни SEO точки:

  1. Пренасочване на оригинални URL адреси към резюмето (301 пренасочване)
  2. Персонализирайте вътрешните връзки
  3. коригиране на външни връзки
  4. Почистване на карти на сайта (пренасочени URL адреси, нови URL адреси в)

Канонизиране на съдържанието

Понякога обаче няма да ви отведе никъде да консолидирате съдържанието си. И тогава, когато имате много дубликати 1: 1 на вашия сайт. Тогава (и само тогава) си струва да канонизирате съдържанието. Това е особено вярно при индексиране на алтернативи на съдържание, като печатни версии, мобилни версии или PDF файлове.

Това би изглеждало така:

  • Ние имаме
    1. https://www.beispielseite.de/original-dokument
    2. https://www.beispielseite.de/original-dokument-print-version
    3. https://www.beispielseite.de/original-dokument-kurzversion
    4. https://mobil.beispielseite.de/original-dokument-mobilversion
  • Канонизация в изходния код на HTML документи:

  • Ние имаме:
    1. https://www.beispielseite.de/original-dokument
    2. https://www.beispielseite.de/original-dokument-pdf-version.pdf
  • Канонизация чрез хедър:
    1. при достъп до https://www.beispielseite.de/original-dokument-pdf-version.pdf:

HTTP/1.1 200 OK
Дата: четвъртък, 26 октомври 2017 г. 10:44:59 GMT
Връзка:; rel = "каноничен"
X-SP-TE: 6151
X-Robots-Tag: индекс, следване, noarchive, noodp
Тип съдържание: text/html; charset = UTF-8

Изключете съдържанието от обхождане и индексиране

За просто изключване на желаното съдържание от обхождане и индексиране, можете да работите с robots.txt:

За съжаление това не решава основния проблем. Много по-добре е да използвате фасетирано търсене с PRG Pattern. По този начин избягвате, че роботите могат да „виждат“ и обхождат заявените URL адреси. След това роботът получава само „оригиналната страница“ - и потребителите не забелязват нищо от това.

С модела PRG обаче трябва да отбележите, че зависи от решението дали се поддържа сърфиране в табове. Трябва също така да изключите съответните варианти на филтъра, свързани със SEO, от PRG. Това са например комбинации от продукти и цветове с голям обем на търсене.

Радикално излекуване: деиндексиране на съдържанието

В много случаи обаче нито една от тези опции наистина не помага. Например, ако в индекса имате неподходящо съдържание от далечното минало, няма смисъл да го канонизирате или консолидирате. За каква цел все още трябва да служат остарели рецензии за продукти, страници с профили, продуктови страници, страници с марка, тематични страници или авторски страници?

Затова направете вътрешния тест и си задайте три въпроса:

  1. Страниците на тетивата (все още)?
  2. Имат ли вътрешен и външен трафик?
  3. Търсят ли се и намират ли се чрез вътрешно търсене?

Ако отговорите отрицателно три пъти тук, ще помогне само кодът на състоянието 410. За да ускорите това изтриване, можете да поставите съответните URL адреси във външна карта на сайта. След това го гледайте, докато не бъде напълно обработен от Google и след това го изтрийте отново. Последната точка не трябва да се подценява, защото ако забравите да я изтриете, в Search Console ще има много грешки. 410 основно не принадлежат към картата на сайта.

И тогава?

Сега имате пътна карта, с която можете да подобрите или да се отървете от нежеланото си съдържание. Но индексната диета не е самоцел! Цялото нещо е от малка полза за вас, ако предварително не дефинирате устойчиви цели. Това включва

  • обединяването на общия трафик на всички отделни страници на една страница,
  • обединяването на класирането на един URL адрес,
  • подобряването на класацията,
  • получаване на нови класации,
  • подобряване на обхождането и
  • подобряване на ефективността на индекса: колко страници се класират и колко се индексират? Страниците, които не се класират, обикновено също не трябва да се индексират.

За да сте сигурни, че тези цели са постигнати, разбира се, трябва след това да наблюдавате регистрационните файлове и да проверявате за промени. Трябва също така да следите класирането на новите или други страници и да наблюдавате трафика на съответните URL адреси. И за да бъдете на сигурно място, няма как да навреди да проверявате препращането на редовни интервали.

След това можете да увеличите видимостта си точно така в следващите примери. Маркерите показват датата, на която са премахнати излишните URL адреси. Стойностите за сравнение в таблиците говорят сами за себе си. Приятно копиране.

Фиг. 13: 18 000 индексирани страници вместо повече от 380 000 - и успехът настъпва.

Фиг. 14: 10 000 вместо 200 000 индексирани страници водят до забележимо увеличение на видимостта.