<<
>>

Метод фильтрации спама, основанный на теореме Байеса

Априорные гипотезы представляют собой так называемый вес слова – вероятность того, что это слово спам.

Далее мы должны с какой периодичностью заниматься обучением – вручную раскладывать письма на spam и ham (то, что можно есть J), запускать процесс обучения, после которого произойдет переоценка весов (первоначальных или текущих гипотез – если это процедуру мы проделываем уже не первый раз). После чего мы ожидаем очередной порции спама. С какого-то момента, наш фильтр будет достаточно точно различать спам. Но, время от времени, нам придется эту процедуру проделывать еще не раз. Обычно, этим занимаются администраторы почтовых серверов, для которых обучающие байесианские алгоритмы являются стандартным средством против спама.

Таким образом, Томас Байес, сам об этом не подозревая, внес свой весомый вклад в дело борьбы со спамом.

<< | >>
Источник: Курс "Теории вероятностей" в рамках "Спец. глав математики". 2017

Еще по теме Метод фильтрации спама, основанный на теореме Байеса:

  1. Глава III. Пути и средства увеличения вывоза наших товаров и уменьшения нашего потребления иностранных товаров