Автор Тема: Получение списка слов  (Прочитано 2611 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Заглянувший

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 11
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Получение списка слов
« : 18 Апреля 2005, 07:18:31 »
Есть обычный текст, например их книги, в котором также встречаются HTML-теги, спецсимволы (  и т.п.).
Нужно получить из этого текста список слов (за исключением стоп-слов) в массиве, отсортированных по частоте их "встречания" в тексте.
Как лучше сделать. Т.е. что и в каком порядке делать?
« Последнее редактирование: 18 Апреля 2005, 08:13:09 от Заглянувший »

Оффлайн Меняздесьдавнонет

  • новичЕк
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 5698
  • +0/-0
  • 2
    • Просмотр профиля
    • http://
Получение списка слов
« Ответ #1 : 18 Апреля 2005, 07:52:45 »
список слов, наверное?
самое простое - это explode и array_count_values
strip_tags, возможно
остальное слишком туманно, чтобы можно было ответить

Оффлайн Заглянувший

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 11
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Получение списка слов
« Ответ #2 : 18 Апреля 2005, 08:12:57 »
Цитировать
RomikChef:
список слов, наверное?

Да, описался.

Цитировать
RomikChef:
explode

По пробелу? А как быть с знаками препинания?

Оффлайн Меняздесьдавнонет

  • новичЕк
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 5698
  • +0/-0
  • 2
    • Просмотр профиля
    • http://
Получение списка слов
« Ответ #3 : 18 Апреля 2005, 09:26:48 »
можно использовать preg_split

 

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28