А если свой парсер? Независимый от платформы?
Структуру изначального шаблона в случае Word я могу задать, например, он может содержать только вордовские заголовки, а в остальном аккуратное форматирование, которое позволит хотя бы разделить документ на блоки.
С экселем сложнее, но, насколько я понимаю, он сам изначально более структурирован.