Как правильно найти систему: возникающие проблемы

09.08.2019

Первая и главная проблема, возникающая перед поисковой системой является постоянно увеличивающийся размер индексной базы ПС. Индексную базу нужно хранить, а поскольку размер этот непрерывно растет, то места для хранения нужно все больше. Эта проблема будет маячить перед ПС все время и решить ее можно лишь путем увеличения количества server’ов. Yandex пользуется уже более чем десятью дата-центрами, в которых находятся несколько тысяч серверов. Ранее Яндекс индексировал лишь русскоязычный internet и выход на мировой рынок начался недавно. Что же тогда говорить о Гугле, который сейчас лидирует в производстве компьютеров, которые идут на нужды непосредственно гиганта поиска.

Второй основной проблемой, которая стоит перед ПС является борьба с копиями в выдаче. Зачем это нужно, более подробно описано на SEO блоге, но я тоже вам расскажу. Если из индексной базы выбросить все дубликаты, то ПВ от этого не ухудшится, но место, нужное для хранения сжатой индексной базы, даст возможность сэкономить большие средства.

Следовательно ПС будут вести борьбу на всех фронтах за то, чтобы убрать дубликаты из выдачи. Борются с дубликатами удалением их из выдачи и мерами, которые предписывают веб-мастерам бороться с дублированным контентом на собственных сайтах. В случае игнорирования этого требования ПС, то к сайтам могут применяться санкции в виде фильтров, вылета страниц из индекса и тому подобное.

Следующей проблемой является спам в выдаче. Подобный спам попадает в выдачу во время использования черных способов поисковой оптимизации. Это может быть дорвеи, клоакинг и тому подобное. С этими способами поисковой оптимизации поисковые системы борются весьма удачно. Дорвеи не живут длительное время, однако до победы еще далеко, ибо черное СЕО приносит доход владельцам, поэтому они будут постоянно искать возможность «надуть» поисковики.

Также остро стоит вопрос обновление базы, дабы они отвечала текущему положению дел. Нужно и искать новые документы и обновлять уже проиндексированные. В общем забот у поисковых систем хватает.

Советуем прочитать