· 

Поисковик Google получил патент на уникальный алгоритм по определению качества контента

Google. Контент

Компания Google запатентовала уникальную технологию, посредством которой обеспечивается охрана оригинального алгоритма для оценки качественных характеристик текстового контента и корректного расчёта PageRank. Данный алгоритм применяется поисковой системой для выявления интернет-страниц, обладающих низкопробными или автоматическими сгенерированными материалами.


Новая запатентованная технология определения качества текстового контента даёт исчерпывающее и однозначное определение низкокачественных «мусорных» текстов, которые предназначены для искусственного поднятия трафика и обхода правил поисковых алгоритмов Google («черная» или запрещенная оптимизация веб-сайтов).

 

Некоторые критерии определения подобного контента приведены ниже:

 

  • Автоматически сформированные спамовые тексты с малоценным или бесполезным содержанием.
  • Приобретение низкокачественных статей и текстов на биржах дешевого контента.
  • Непрофессиональные переводы с других языков с помощью специальных программ и приложений.
  • Избыточное перенасыщение контента ключевыми фразами.
  • Заведомо ошибочный синтаксис, безграмотная лексика и морфология.
  • Использование неестественного порядка слов и словосочетаний, нехарактерных для языковых групп и диалектов.

 

 

Представители компании Google особо подчеркивают, что авторы спамовых текстов и владельцы веб-сайтов с низкокачественным контентом стремятся монетизировать нецелевой коммерческий трафик. Подобные интернет-ресурсы часто участвуют аффилированных и партнёрских программах, содержат огромное количество непрофильных рекламных материалов и занимаются продажей исходящих ссылок.

 

 


Патент Гугл для определения качества текстового контента

Технология Google для определения качества текстового контента состоит из ряда этапов:

 

  • Создание готовых языковых моделей с учетом особенностей каждой группы интернет-ресурсов.
  • Использование конкретной языковой модели при проверке текстового наполнения веб-ресурса.
  • Проведение анализа контента на предмет соответствия критериям алгоритма (см. выше).
  • После выполнения расчётов проводится автоматическая коррекция позиций сайта в поисковой выдаче Google по запросам пользователей.

 

Оценка качества страниц интернет-ресурсов выполняется статистическими методами. При использовании метода шинглов всё текстовое содержание страниц разбивается на отдельные части, состоящие из нескольких подряд идущих слов. После анализа данной страницы и получения статистической информации, алгоритм производит сравнение содержимого сайта с другими интернет-ресурсами. По заявлению представителей ведущей поисковой системы, новая запатентованная технология предназначена для улучшения качественных характеристик поисковой выдачи и обеспечения релевантности ответов Google на запросы интернет-пользователей.

 

 

 

 

 

 

 

 

 

© WaterMillSky 2012-2016