Основные способы предварительной обработки текстовых документов для уменьшения размерности задачи классификации. Области применения автоматической классификации. Стемминг, лемматизация и стоп-слова как способы улучшения обработки текстовой информации.
Аннотация к работе
Классификация текстовых документов. Уменьшение размерности задачи и повышение производительности Федотов Р.Г. Аннотация В данной статье рассматривается понятие классификации и основные направление, где она используется. Так же автор описывает основные способы предварительной обработки текстовых документов, для уменьшения размерности задачи классификации и повышение производительности систем, такие как стемминг, лемматизация, стоп-слова.