Forum Webscript.Ru
Программирование => Perl => Тема начата: USE от 10 Сентября 2002, 23:17:36
-
Не знал куда еще можно написать (т.е. в какой форум). Короче надо делать фильтрацию входящих сообщений на наличие сабжа.
вопрос такой: где можно достать приличную базу ругательств как русских так и не русских. в исходниках YaBB\'а нашел небольшой файлик с цензурой, но этого мало, ведь русский язык куда более могучий :)
я где-то встречал модуль для перла, в этих целях его автор использовал, а теперь найти его хоумпейдж не могу, как модуль назывался тоже не помню :) наверняка у него была хорошая база матерных слов.
Очень надо :p
-
"Если не можете что-нибудь найти, и Вам ничего не помогает, воспользуйтесь наконец поиском" (с) - навродная мудрость:-)
В тындексе по первой ссылке:
http://www.ya.ru/yandsearch?text=%E0%ED%F2%E8%EC%E0%F2+%CF%E5%F0%EB+%EC%EE%E4%F3%EB%FC
Сам сайт:
http://www.tcen.ru/antimat/
А тема эта ИМХО в Перл-форум.
-
переехали в perl
-
http://www.tcen.ru/antimat/
казырно ребята постарались:
эксперементировал с русским матом с использованием английских букв,или альтернативно чисто на аглицких буквах:
/7PuBET (пример)
все нашло все на бип заменил
-
>http://www.tcen.ru/antimat/
вещь удобная, а если нельзя установить библиотеку на сервере, возможно ли самому что то похожее написать, есть список мат. слов, в текстовом файле, по кол-ву слов делаешь цикл, и так каждый раз сравниваешь основной текст, или это слишком долго получится?
Как ещё можно красиво проверить множество слов в тексте?
-
От перебора все-равно никуда не денешься, но вряд-ли твоего словаря будет достаточно. Не забывай, что все или часть букв можно заменять английскими и не только, на одно крепкое русское слово может приходится и сотня вариантов его написания. Сам модуль не смотрел, но думаю там более хитрый алгоритм.
Рекомендую все же использовать готовый модуль. В крайнем случае, покопайся в нем и сделай выводы.