Forum Webscript.Ru

Программирование => PHP => Тема начата: Заглянувший от 18 Апреля 2005, 07:18:31

Название: Получение списка слов
Отправлено: Заглянувший от 18 Апреля 2005, 07:18:31
Есть обычный текст, например их книги, в котором также встречаются HTML-теги, спецсимволы (  и т.п.).
Нужно получить из этого текста список слов (за исключением стоп-слов) в массиве, отсортированных по частоте их "встречания" в тексте.
Как лучше сделать. Т.е. что и в каком порядке делать?
Название: Получение списка слов
Отправлено: Меняздесьдавнонет от 18 Апреля 2005, 07:52:45
список слов, наверное?
самое простое - это explode и array_count_values
strip_tags, возможно
остальное слишком туманно, чтобы можно было ответить
Название: Получение списка слов
Отправлено: Заглянувший от 18 Апреля 2005, 08:12:57
Цитировать
RomikChef:
список слов, наверное?

Да, описался.

Цитировать
RomikChef:
explode

По пробелу? А как быть с знаками препинания?
Название: Получение списка слов
Отправлено: Меняздесьдавнонет от 18 Апреля 2005, 09:26:48
можно использовать preg_split