Forum Webscript.Ru
Общие => Веб-технологии => Тема начата: Stas от 21 Ноября 2002, 23:49:01
-
Liudi,
kto-nibud\' znaet o scriptah ili progah pod linux s vozmozhnostiu "natural language processing".
Est\' idea, sdelat\' sortirovku pochty prihodiashuiu sendmailom po tematicheskim kategoriam. Poisk po kliuchevym slovam - slishkom naivno. AI s Prologom - ?! Mozhet est\' kakie algoritmy pozvoliaiushie nahodit\' kliuchevye slova v texte s nebol\'shimi grammaticheskimi otkloneniami. K primeru ne vse liudi napishut text v email\'e na 100% s tochki zrenia orfografii.
Ili nahozhdenie protsenta otnositel\'nosti k teme opisannoi gruppoi kliuchevyh slov.. Chto to tipa "Relevance" v poiskovyh sluzhbah...
Esli kto chio znaet po etomu povodu.. Pishite..
-
ИМХО:
1. делаеш почтового робота (на php.spb.ru нормально описывалось это дело) .
2. По приходу почту парсиш письмо (я для этого pear :: mail :: mimeDecode использовал) и записываеш например в БД. А там уже и сортировки можно сделать и релевантность и т.д.
-
nu da na tom zhe servere gde i 200 millionnyi DB ;) .. Eto u menia (drugoi vopros byl po bazam dannyh)
Naschet kak pochu parsit\', u menia vsio est\'.. A kak byt\' s raznymi iazykami.. Ia imel vvidu chto-to "poumnee" chem prosto string matching..
Ispol\'zuiut che biblioteki ispell i t.d. Vot k primery, mne email prislali a v nem napisano na angl. pro web design.. I kto-to webdesign napishet vmeste, ili s bukvoi "z"... Kakimi sposobami eto mozhno opredelit\'. Dal\'she eto delo mozhno na drugogo usera pihnut\' po MTA, kotoryi budet tol\'ko info po Web Designu poluchat\'....
Filtr dolzhen byt\' "umnym" .. Ia skoree algoritm ishiu chem uzhe gotovoe software... Ili mozhet kakie nibud\' biblioteki kotorye eto delaiut
-
Очень странно задача поставлена. Вообще для сортировки используется сам e-mai (или алиасы; в случае отправки через форму еще и служебные поля заголовка и т.п.)). Т.е., если возникает проблема сортировки, то не надо писать на один адрес по всем вопросам.
-
nu vot v etom to i problema... Predstav\' sebia polzovatelem kotoryi poluchil pis\'mo s predlozheniem na raznye producty. I ty zahochesh\' otvetit\' na nego.. Ty prosto sdelaesh\' reply, i napishesh\' pismo o tom chto tebe interesno.
Drugimi slovami ono priidet na tot zhe ishodnyi adres. I vot tam to ono i perenapravitsia na liuboi drugoi adres, operatora kotoryi znaimaetsia immenno etim productom... I ia prekrasno znaiu chto takoe aliases. Zadacha sovsem drugaia...
-
Что это на спам похоже. Зачем много продуктов в одном письме?
-
nevazhno na chto eto pohozhe... I v liubom sluchae ia by dlia sebia tak delat\' ne stal by, a ispol\'zoval by aliases i virtuser table ili procmail.. ili Mailscanner.. Ili cherti-znaet chto, tipa svoego scripta..
Sushetvuiut\' Natural Language Processing algoritmy, moi vopros esli kto znaet o takom proekte na Linuxe v realizatsii PHP, Perl, C ...
-
Pohozhe malo kto takimi chisto teoreticheskimi i abstractnymi veshiami zamorachivaetsia kak "Natural Langugage Processing"...
Макс spasibo za ssylku, s pomoshiu robota na samom dele proshe sdelat\' filtry..