Forum Webscript.Ru

Программирование => Perl => Тема начата: USE от 10 Сентября 2002, 23:17:36

Название: Ругательства, матерные слова...
Отправлено: USE от 10 Сентября 2002, 23:17:36
Не знал куда еще можно написать (т.е. в какой форум). Короче надо делать фильтрацию входящих сообщений на наличие сабжа.

вопрос такой: где можно достать приличную базу ругательств как русских так и не русских. в исходниках YaBB\'а нашел небольшой файлик с цензурой, но этого мало, ведь русский язык куда более могучий :)

я где-то встречал модуль для перла, в этих целях его автор использовал, а теперь найти его хоумпейдж не могу, как модуль назывался тоже не помню :) наверняка у него была хорошая база матерных слов.

Очень надо :p
Название: Ругательства, матерные слова...
Отправлено: glebushka от 11 Сентября 2002, 00:47:53
"Если не можете что-нибудь найти, и Вам ничего не помогает, воспользуйтесь наконец поиском" (с) - навродная мудрость:-)
В тындексе по первой ссылке:
http://www.ya.ru/yandsearch?text=%E0%ED%F2%E8%EC%E0%F2+%CF%E5%F0%EB+%EC%EE%E4%F3%EB%FC
Сам сайт:
http://www.tcen.ru/antimat/
А тема эта ИМХО в Перл-форум.
Название: Ругательства, матерные слова...
Отправлено: Britva от 11 Сентября 2002, 01:09:14
переехали в perl
Название: Ругательства, матерные слова...
Отправлено: AlieN от 13 Сентября 2002, 14:53:00
Цитировать
http://www.tcen.ru/antimat/

казырно ребята постарались:
эксперементировал с русским матом с использованием английских букв,или альтернативно чисто на аглицких буквах:
/7PuBET (пример)
все нашло все на бип заменил
Название: Ругательства, матерные слова...
Отправлено: Yuraz от 13 Сентября 2002, 19:13:30
>http://www.tcen.ru/antimat/
вещь удобная, а если нельзя установить библиотеку на сервере, возможно ли самому что то похожее написать, есть список мат. слов, в текстовом файле, по кол-ву слов делаешь цикл, и так каждый раз сравниваешь основной текст, или это слишком долго получится?
Как ещё можно красиво проверить множество слов в тексте?
Название: Ругательства, матерные слова...
Отправлено: YA от 13 Сентября 2002, 19:46:54
От перебора все-равно никуда не денешься, но вряд-ли твоего словаря будет достаточно. Не забывай, что все или часть букв можно заменять английскими и не только, на одно крепкое русское слово может приходится и сотня вариантов его написания. Сам модуль не смотрел, но думаю там более хитрый алгоритм.

Рекомендую все же использовать готовый модуль. В крайнем случае, покопайся в нем и сделай выводы.