
Компания Google запатентовала уникальную технологию, посредством которой обеспечивается охрана оригинального алгоритма для оценки качественных характеристик текстового контента и корректного расчёта PageRank. Данный алгоритм применяется поисковой системой для выявления интернет-страниц, обладающих низкопробными или автоматическими сгенерированными материалами.
Новая запатентованная технология определения качества текстового контента даёт исчерпывающее и однозначное определение низкокачественных «мусорных» текстов, которые предназначены для искусственного поднятия трафика и обхода правил поисковых алгоритмов Google («черная» или запрещенная оптимизация веб-сайтов).
Некоторые критерии определения подобного контента приведены ниже:
- Автоматически сформированные спамовые тексты с малоценным или бесполезным содержанием.
- Приобретение низкокачественных статей и текстов на биржах дешевого контента.
- Непрофессиональные переводы с других языков с помощью специальных программ и приложений.
- Избыточное перенасыщение контента ключевыми фразами.
- Заведомо ошибочный синтаксис, безграмотная лексика и морфология.
- Использование неестественного порядка слов и словосочетаний, нехарактерных для языковых групп и диалектов.
Представители компании Google особо подчеркивают, что авторы спамовых текстов и владельцы веб-сайтов с низкокачественным контентом стремятся монетизировать нецелевой коммерческий трафик. Подобные интернет-ресурсы часто участвуют аффилированных и партнёрских программах, содержат огромное количество непрофильных рекламных материалов и занимаются продажей исходящих ссылок.

Технология Google для определения качества текстового контента состоит из ряда этапов:
- Создание готовых языковых моделей с учетом особенностей каждой группы интернет-ресурсов.
- Использование конкретной языковой модели при проверке текстового наполнения веб-ресурса.
- Проведение анализа контента на предмет соответствия критериям алгоритма (см. выше).
- После выполнения расчётов проводится автоматическая коррекция позиций сайта в поисковой выдаче Google по запросам пользователей.
Оценка качества страниц интернет-ресурсов выполняется статистическими методами. При использовании метода шинглов всё текстовое содержание страниц разбивается на отдельные части, состоящие из нескольких подряд идущих слов. После анализа данной страницы и получения статистической информации, алгоритм производит сравнение содержимого сайта с другими интернет-ресурсами. По заявлению представителей ведущей поисковой системы, новая запатентованная технология предназначена для улучшения качественных характеристик поисковой выдачи и обеспечения релевантности ответов Google на запросы интернет-пользователей.