Помогите, плиз,
есть сайт, состоящий из более 1000 хтмл документов, нужно написать скрипт, который бы проиндексировал эти документы не только по тегам keywords и description, но и еще по телу документа, выделяя ключевые слова и записывая их в файл.
Какие можно использовать при этом алгоритмы?