Встала такая проблема, надо скриптом обработать (выдрать оттуда некоторый текст) кучу файлов MS Word, причем в двух версиях - 7 и 5.5 :eek:
Всвязи с этим 2 вопроса
1. Есть ли готовые средства/модули для решения этой задачи
2. Когда пытаюсь прочесть файл Word 5.5, как текстовый
foreach $file (grep {/\\.doc$/i} readdir(DIR))
{open (F, "$dir/$file");
while () {........}
}
то после прочтения 2-х первых символов обработка заканчивается.
Рискну предположить, что где-то встречается символ, который интерпретируется как конец файла.
Как это можно победить?