Forum Webscript.Ru
Программирование => PHP => Тема начата: Заглянувший от 18 Апреля 2005, 07:18:31
-
Есть обычный текст, например их книги, в котором также встречаются HTML-теги, спецсимволы ( и т.п.).
Нужно получить из этого текста список слов (за исключением стоп-слов) в массиве, отсортированных по частоте их "встречания" в тексте.
Как лучше сделать. Т.е. что и в каком порядке делать?
-
список слов, наверное?
самое простое - это explode и array_count_values
strip_tags, возможно
остальное слишком туманно, чтобы можно было ответить
-
RomikChef:
список слов, наверное?
Да, описался.
RomikChef:
explode
По пробелу? А как быть с знаками препинания?
-
можно использовать preg_split