Forum Webscript.Ru
Программирование => Perl => Тема начата: YA от 22 Сентября 2002, 17:27:57
-
Поставил модуль Lingua::Ispell (пока только под Win, ставил с помощью ppm). Однако пример из родной документации вообще не работает: подключение модуля ошибок не вызывает, другого словаря - тоже, но spellcheck ничего не возвращает, а в логах появляется сообщение
"\'истее не уд ется н йти ук з нный путь." - это если перекодировать из DOS.
При этом выполнение этого тестового сценария не прерывается.
Если кто работал с этим модулем, кинте, плиз, пример рабочего кода. Также буду рад любым советам относительно проверки орфографии в Perl.
-
Если я правильно понял, то этот модуль является всего лишь интерфейсом для ispell. То есть нужно сначала поставить сам ispell.
-
Н-да... поторопился я. Думал, что он самодостаточен - подключил словарь и вперед...
Тогда другой вопрос: что такое ispell (под *nix, Win32)?
-
По ispell некоторую инфу нашел - этот вопрос снят. Но задача не решена... нужно сделать самую примитивную проверку русской орфографии для поиска опечаток без какого-либо морфоанализа. Предполагаю, что можно обойтись и русским словарем от ispell - поиск слов, отсутствующих в словаре.
Если кто занимался подобными вещами, поделитесь опытом.
КшЫуфксрук, судя по одной из недавних тем в соседнем форуме, тебе знаком этот вопрос.
Есть следующие вопросы:
- Как читать то, что в словаре после "/"? - вопрос принципиальный.
- На какую скорость можно расчитывать?
- Реально ли по такому словарю сделать предложение вариантов?
-
[OFF]КшЫуфксрук а скрипты на http://risearch.org/ твоя работа?[/OFF]
-
Все таки проще всего попробовать поставить ispell. Я где-то видел уже откомпиленный под DOS.
Что касается вопросов:
1) После слэша стоят ключи, которые указывают, по каким правилам изменяется данное слово. Сами правила находятся в affix-файле. Там все достаточно понятно, либо потом могу пояснить непонятные вещи. Кроме того, стоит посмотреть на http://ispell.narod.ru/ Этот скрипт конечно решает только малую часть проблемы, но можно с него начать.
2) А какая скорость нужна? Для скорости лучше всего использовать готовую сишную программу, быстрее все равно на Перле не сделаешь. У меня пока пиковая скорость около 3000-4000 слов в секунду в режиме нормализации. Если же скорость не слишком важна, тогда проблем меньше, можно делать хоть тупым перебором.
3) Как работает подсказка я, честно говоря, абсолютно не интересовался.
To glebushka: Да.
-
В affix-файле не понятно только, что значат "#y" и "#e" в начале некоторых строк.
[OFF]Пока думаю над алгоритмом... возможно, вопросы еще появятся.[/OFF]