Forum Webscript.Ru

Общие => Веб-технологии => Тема начата: Stas от 21 Ноября 2002, 23:49:01

Название: Sendmail - Sortirovka pochty po teme soderzhania (!!)
Отправлено: Stas от 21 Ноября 2002, 23:49:01
Liudi,
kto-nibud\' znaet o scriptah ili progah pod linux s vozmozhnostiu "natural language processing".

Est\' idea, sdelat\' sortirovku pochty prihodiashuiu sendmailom po tematicheskim kategoriam. Poisk po kliuchevym slovam - slishkom naivno. AI s Prologom - ?! Mozhet est\' kakie algoritmy pozvoliaiushie nahodit\' kliuchevye slova v texte s nebol\'shimi grammaticheskimi otkloneniami. K primeru ne vse liudi napishut text v email\'e na 100% s tochki zrenia orfografii.

Ili nahozhdenie protsenta otnositel\'nosti k teme opisannoi gruppoi kliuchevyh slov.. Chto to tipa "Relevance" v poiskovyh sluzhbah...


Esli kto chio znaet po etomu povodu.. Pishite..
Название: Sendmail - Sortirovka pochty po teme soderzhania (!!)
Отправлено: Макс от 22 Ноября 2002, 01:54:47
ИМХО:
1. делаеш почтового робота (на php.spb.ru нормально описывалось это дело) .
2. По приходу почту парсиш письмо (я для этого pear :: mail :: mimeDecode использовал) и записываеш например в БД. А там уже и сортировки можно сделать и релевантность и т.д.
Название: Sendmail - Sortirovka pochty po teme soderzhania (!!)
Отправлено: Stas от 22 Ноября 2002, 02:08:55
nu da na tom zhe servere gde i 200 millionnyi DB ;) .. Eto u menia (drugoi vopros byl po bazam dannyh)

Naschet kak pochu parsit\', u menia vsio est\'.. A kak byt\' s raznymi iazykami.. Ia imel vvidu chto-to "poumnee" chem prosto string matching..

Ispol\'zuiut che biblioteki ispell i t.d. Vot k primery, mne email prislali a v nem napisano na angl. pro web design.. I kto-to webdesign napishet vmeste, ili s bukvoi "z"...  Kakimi sposobami eto mozhno opredelit\'. Dal\'she eto delo mozhno na drugogo usera pihnut\' po MTA, kotoryi budet tol\'ko info po Web Designu poluchat\'....

Filtr dolzhen byt\' "umnym" .. Ia skoree algoritm ishiu chem uzhe gotovoe software... Ili mozhet kakie nibud\' biblioteki kotorye eto delaiut
Название: Sendmail - Sortirovka pochty po teme soderzhania (!!)
Отправлено: YA от 22 Ноября 2002, 08:37:28
Очень странно задача поставлена. Вообще для сортировки используется сам e-mai (или алиасы; в случае отправки через форму еще и служебные поля заголовка и т.п.)). Т.е., если возникает проблема сортировки, то не надо писать на один адрес по всем вопросам.
Название: Sendmail - Sortirovka pochty po teme soderzhania (!!)
Отправлено: Stas от 22 Ноября 2002, 12:39:00
nu vot v etom to i problema... Predstav\' sebia polzovatelem kotoryi poluchil pis\'mo s predlozheniem na raznye producty. I ty zahochesh\' otvetit\' na nego.. Ty prosto sdelaesh\' reply, i napishesh\' pismo o tom chto tebe interesno.

Drugimi slovami ono priidet na tot zhe ishodnyi adres. I vot tam to ono i perenapravitsia na liuboi drugoi adres, operatora kotoryi znaimaetsia immenno etim productom...  I ia prekrasno znaiu chto takoe aliases. Zadacha sovsem drugaia...
Название: Sendmail - Sortirovka pochty po teme soderzhania (!!)
Отправлено: YA от 22 Ноября 2002, 14:35:21
Что это на спам похоже. Зачем много продуктов в одном письме?
Название: Sendmail - Sortirovka pochty po teme soderzhania (!!)
Отправлено: Stas от 22 Ноября 2002, 14:44:29
nevazhno na chto eto pohozhe... I v liubom sluchae ia by dlia sebia tak delat\' ne stal by, a ispol\'zoval by aliases i virtuser table ili procmail.. ili Mailscanner.. Ili cherti-znaet chto, tipa svoego scripta..

Sushetvuiut\' Natural Language Processing algoritmy, moi vopros esli kto znaet o takom proekte na Linuxe v realizatsii PHP, Perl, C ...
Название: Sendmail - Sortirovka pochty po teme soderzhania (!!)
Отправлено: Stas от 25 Ноября 2002, 21:25:06
Pohozhe malo kto takimi chisto teoreticheskimi i abstractnymi veshiami zamorachivaetsia kak "Natural Langugage Processing"...

Макс spasibo za ssylku, s pomoshiu robota na samom dele proshe sdelat\' filtry..