Распространенные приемы проверки уникальности

H

Helenka1

#1
Сейчас мы рассмотрим варианты проверки большого объема текста на уникальность.

- Из предложений убирают предлоги, знаки препинания, союзы и другие слова, не несущие напрямую смысловой нагрузки, это называется канонизация текста.

- Текст разбивают на шинглы (отрезки текста длиной 5-7 слов) и проверяется внахлест с возможным дубликатом, так используют шинглы.

- Использовав сами шинглы в качестве поисковых запросов вы проведете простое сравнение.

- Не стоит опускаться ниже 80% по уникальности текста.

При том количестве информации, которой пестрит инет, всегда можно сделать сборную солянку из разных источников и получить очень оригинальный текст, к которому ПС не смогут придраться.
 
V

VyacheslavH

#2
И в результате этой драки становится очень сложно найти в сети свежую и незаезженную мысль. Разве что на форумах с высоким уровнем троллинга :D
 
H

Helenka1

#3
VyacheslavH, а что ты хотел, издержки производства :D.

Добавлено через 6 минут
VyacheslavH, а ты не ищи свежие мысли, ты свои генерируй ;)
 
V

VyacheslavH

#4
Helenka, та не вопрос :D Я когда пишу, у меня исключительно своё. Но когда читаю других, хочется получать кайф, а не лечить дажавю :crazy:
 
H

Helenka1

#5
VyacheslavH, ну, ищите первоисточник мысли :pardon:. Не всем нравятся оригинальные идеи. :crazy:
 
V

VyacheslavH

#6
VyacheslavH, ну, ищите первоисточник мысли :pardon:.
В первоисточнике информации бывает недостаточно. А когда ищешь есчо, находишь пошарпаный копипаст :D Свои мысли искать нонешний народ ленив есть :D
 
N

nayturs

#7
А есть какие-нибудь программы, позволяющие сравнивать два или более конкретных текста на предмет уникальности каждого?
 
H

Helenka1

#8
nayturs, не поняла вопроса. Опубликованные в инете тексты или написанные вами и хотите сравнить, насколько они отличаются?
 
N

nayturs

#9
Не опубликованные в интернете.
 
W

Wmboard

#12
А есть какие-нибудь программы, позволяющие сравнивать два или более конкретных текста на предмет уникальности каждого?

Есть программа, которая видит отличия двух загруженных текстов. Стоп слова, шинглы и прочие штучки. Посмотрю, если осталась - выложу.
 
H

Helenka1

#16
nayturs, подождем, что Ветер выложит, у меня пока такой надобности не возникало.
 
W

Wmboard

#17
Наверное не сегодня... трудный день
 
S

SpyroSpirit

#18
Хочется чего-то ещё, онлайновые программы обычно не слишком точные.
Как вариант, утилита Advego Plagiatus. Вбиваешь адрес сайта-источника, ниже текст, проверяешь и смотришь проценты уникальности текста (там же можно отыскать "недобросовестных заимствователей" контента :))
 
H

Helenka1

#19
Как вариант, утилита Advego Plagiatus. Вбиваешь адрес сайта-источника, ниже текст, проверяешь и смотришь проценты уникальности текста (там же можно отыскать "недобросовестных заимствователей" контента :))

Нет, Адвего работает только с одним текстом и ищет его клонов в сети. Тут же нужно сравнить два текста, которые еще не выложены в инет.
 
S

SpyroSpirit

#20
Тут же нужно сравнить два текста, которые еще не выложены в инет.
Это актуально, как я понимаю, только для тех, кто переписывает один и тот же смысл другими словами?(рерайтеры/копирайтеры, не помню кто из них)
Для генераторов контента или тех, кто переводит тексты с английского на русский, нет надобности сравнивать 2 текста. Или я не прав?
 
H

Helenka1

#21
SpyroSpirit, ты прав только отчасти. Но если хозяин сайта заказывает рерайт (это как раз переписывание текста своими словами), то ему нужно убедиться, что уникальность предоставленной работы высока. Это как раз и даст проверка двух текстов. Либо когда нужно сделать несколько текстов с одного исходника, вот тебе еще один вариант, когда нужно сравнить неопубликованные статьи.

[ADMIN="Veter"]Линукс перемещен https://lumtu.com/operacionnaya-sistema/1307-linux-ili-windows-5.html[/ADMIN]
 
Get involved!

Here you can only see a limited number of comments. On СЕО Форум Вебмастеров you see all comments and all functions are available to you. To the thread