Среди функций php есть strip_tags, которая режет все html-теги или некоторые, на выбор, и оставляет от них только текст.
Правда, после такой обработки html-файла, полученного из *.doc,
все равно останется немного мусора, но зато дизайн твоего сайта сохранится.
Или просто срезать все тэги и оставить голый текст - тебе недостаточно?