Forum Webscript.Ru

Программирование => Perl => Тема начата: YA от 22 Сентября 2002, 17:27:57

Название: Проверка орфографии - Lingua::Ispell
Отправлено: YA от 22 Сентября 2002, 17:27:57
Поставил модуль Lingua::Ispell (пока только под Win, ставил с помощью ppm). Однако пример из родной документации вообще не работает: подключение модуля ошибок не вызывает, другого словаря - тоже, но spellcheck ничего не возвращает, а в логах появляется сообщение
"\'истее не уд ется н йти ук з нный путь." - это если перекодировать из DOS.
При этом выполнение этого тестового сценария не прерывается.

Если кто работал с этим модулем, кинте, плиз, пример рабочего кода. Также буду рад любым советам относительно проверки орфографии в Perl.
Название: Проверка орфографии - Lingua::Ispell
Отправлено: КшЫуфксрук от 22 Сентября 2002, 19:56:12
Если я правильно понял, то этот модуль является всего лишь интерфейсом для ispell. То есть нужно сначала поставить сам ispell.
Название: Проверка орфографии - Lingua::Ispell
Отправлено: YA от 22 Сентября 2002, 21:39:37
Н-да... поторопился я. Думал, что он самодостаточен - подключил словарь и вперед...

Тогда другой вопрос: что такое ispell (под *nix, Win32)?
Название: Проверка орфографии - Lingua::Ispell
Отправлено: YA от 22 Сентября 2002, 22:04:51
По ispell некоторую инфу нашел - этот вопрос снят. Но задача не решена... нужно сделать самую примитивную проверку русской орфографии для поиска опечаток без какого-либо морфоанализа. Предполагаю, что можно обойтись и русским словарем от ispell - поиск слов, отсутствующих в словаре.

Если кто занимался подобными вещами, поделитесь опытом.
КшЫуфксрук, судя по одной из недавних тем в соседнем форуме, тебе знаком этот вопрос.

Есть следующие вопросы:
- Как читать то, что в словаре после "/"? - вопрос принципиальный.
- На какую скорость можно расчитывать?
- Реально ли по такому словарю сделать предложение вариантов?
Название: Проверка орфографии - Lingua::Ispell
Отправлено: glebushka от 23 Сентября 2002, 03:55:09
[OFF]КшЫуфксрук а скрипты на http://risearch.org/ твоя работа?[/OFF]
Название: Проверка орфографии - Lingua::Ispell
Отправлено: КшЫуфксрук от 23 Сентября 2002, 06:33:36
Все таки проще всего попробовать поставить ispell. Я где-то видел уже откомпиленный под DOS.

Что касается вопросов:

1) После слэша стоят ключи, которые указывают, по каким правилам изменяется данное слово. Сами правила находятся в affix-файле. Там все достаточно понятно, либо потом могу пояснить непонятные вещи. Кроме того, стоит посмотреть на http://ispell.narod.ru/ Этот скрипт конечно решает только малую часть проблемы, но можно с него начать.

2) А какая скорость нужна? Для скорости лучше всего использовать готовую сишную программу, быстрее все равно на Перле не сделаешь. У меня пока пиковая скорость около 3000-4000 слов в секунду в режиме нормализации. Если же скорость не слишком важна, тогда проблем меньше, можно делать хоть тупым перебором.

3) Как работает подсказка я, честно говоря, абсолютно не интересовался.

To glebushka: Да.
Название: Проверка орфографии - Lingua::Ispell
Отправлено: YA от 24 Сентября 2002, 00:14:41
В affix-файле не понятно только, что значат "#y" и "#e" в начале некоторых строк.

[OFF]Пока думаю над алгоритмом... возможно, вопросы еще появятся.[/OFF]