Popsicle в настоящее время пробует свои силы в работе над кодом самого программного обеспечения. Я использую:
Инструмент исследования предметной области — Lezon Inc.
Фильтрация доменов с помощью регулярных выражений
Новейшим дополнением к DRT является функция, которая позволяет использовать регулярные выражения в формате .NET (RegEx) для фильтрации списков доменов.
Регулярные выражения допускают практически неограниченную настройку при фильтрации ключевых слов.
Например, вы можете фильтровать домены, содержащие LLL.tld, NNN.tld, NLN.tld, начинающиеся с i или e, содержащие слово «test» в качестве третьего символа и многое другое.
Эта функция доступна на вкладке «Параметры->Настройки фильтра->Дополнительные настройки ключевых слов».
Регулярное выражение — это специальная текстовая строка, описывающая шаблон поиска.
Хотя синтаксис и использование регулярных выражений выходят за рамки этого файла справки (регулярные выражения могут быть очень сложными или очень простыми, в зависимости от ваших потребностей), мы объясним очень простой синтаксис регулярных выражений и настоятельно рекомендуем вам оформить заказ.
Google
, или
RegEx приятель
для получения дополнительной помощи.
Примеры команд сопоставления:
^ = совпадение должно существовать в начале строки, например: ^(e) будет соответствовать любому домену, который начинается с буквы e
$ = совпадение должно существовать в конце строки, например: (e)$ будет соответствовать любому домену, который заканчивается на букву e, но помните, что домены всегда заканчиваются расширением.
| = или условно, например: (дешево|бесплатно|доступно) будет соответствовать любому домену, который содержит слова дешево, бесплатно или доступно (обратите внимание, без пробелов)
. = любой символ, например: (gr.y) будет соответствовать Gray.com, grey.com, grzy.com, но не gry.com
(дешево|бесплатно)\. = домен должен заканчиваться на «дешево» или «бесплатно» (замечено, что мы убрали точку с помощью \.)
Более подробную информацию о регулярных выражениях можно найти по ссылке ниже:
http://www.regular-expressions.info/quickstart.html
Как работает D.R.T. соответствовать регулярным выражениям?
Когда сопоставление регулярных выражений включено, инструмент исследования предметной области перебирает все «включенные» регулярные выражения и пытается сопоставить текущий домен (вставленный или загруженный из файла) с регулярным выражением.
Если совпадение найдено даже для одного включенного правила регулярного выражения, значит, домен прошел проверку, в противном случае он не прошел проверку (и не будет добавлен в список сканирования).
При использовании регулярных выражений наблюдается небольшое снижение производительности.
В среднем файл, содержащий 100 000 доменов, будет загружаться на 2 секунды медленнее при использовании двух правил регулярных выражений.
Зачем использовать регулярные выражения?
Регулярные выражения обеспечивают чрезвычайно гибкое сопоставление с образцом.
Вы можете настроить регулярное выражение так, чтобы оно соответствовало как одному правилу, так и сложному набору из десятков правил (например: домен длиной не более 10 символов, содержит только буквы, имеет третью букву «z», содержит a,e ,я,о,вы все в одном правиле).
Есть ли генератор регулярных выражений?
Мы используем инструмент под названием
RegEx приятель
(без принадлежности). Он не бесплатный, но отлично справляется с созданием и тестированием регулярных выражений.