Автор Тема: Получение списка слов (Прочитано 2624 раз)

Заглянувший · « : 18 Апреля 2005, 07:18:31 »

Есть обычный текст, например их книги, в котором также встречаются HTML-теги, спецсимволы ( и т.п.).
Нужно получить из этого текста список слов (за исключением стоп-слов) в массиве, отсортированных по частоте их "встречания" в тексте.
Как лучше сделать. Т.е. что и в каком порядке делать?

Меняздесьдавнонет · « **Ответ #1 :** 18 Апреля 2005, 07:52:45 »

список слов, наверное?
самое простое - это explode и array_count_values
strip_tags, возможно
остальное слишком туманно, чтобы можно было ответить

Заглянувший · « **Ответ #2 :** 18 Апреля 2005, 08:12:57 »

Цитировать

RomikChef:
список слов, наверное?

Да, описался.

Цитировать

RomikChef:
explode

По пробелу? А как быть с знаками препинания?

Меняздесьдавнонет · « **Ответ #3 :** 18 Апреля 2005, 09:26:48 »

можно использовать preg_split

Новости:

Автор Тема: Получение списка слов (Прочитано 2624 раз)