Шингл

Звенья одной цепи, образующей предложения и лежащей в основе текста, называются шинглами. Именно благодаря шинглам контент проверяется на уникальность.

При использовании способа канонизации, шинглом называется та часть текста, которая уже была проанализирована. По своей сути, канонизация это способ удаления слов, которые не несут никакой смысловой нагрузки, а также знаков препинания от остального текста.

После того как текст будет канонизирован, его разделяют на шинглы. При проверке уникальности указывается длина шингла, потому что именно от неё зависит корректность анализа. Если указать маленький шингл, анализ будет долгим, но наиболее точным. Длина шингла может варьироваться в промежутке между 3 и 8.

Если длина превышает 8, то шингл будет непригоден для проверки уникальности. Для формирования шингла используется цепочка – 1 или 2 слова из первого шингла присоединяются к первому слову из второго шингла.

После разбивки текста, начинается деятельность программистов. Используя специальный алгоритм, они сравнивают шинглы двух текстов и выявляя совпадения, просчитывают их процент.

Как мы работаем?

1

Звонок или заявка

Звонок
или заявка

2

Встреча и знакомство

Встреча
и знакомство

3

Заключение договора

Заключение
договора

4

Предоплата 50%

Предоплата
50%

5

Согласование дизайна и структуры сайта

Согласование
дизайна
и структуры сайта

6

Сдача сайта

Сдача
сайта