Машинное обучение и статистические методы анализа данных. Оценка точности прогнозирования. Предварительная обработка данных. Методы классификации, регрессии и анализа временных рядов. Методы ближайших соседей, опорных векторов, спрямляющего пространства.
Аннотация к работе
В своей работе ученые строят прогнозы, основываясь на таких факторах, как биржевые котировки сырьевых товаров и процентных ставках. Они сравнивают данные методы с моделью, построенной с помощью анализа временных рядов. Также делает и Barbara Rossi в статье «Exchange Rate Predictability». Любая задача машинного обучения подразумевает наличие выборки - совокупности данных, представляемой в виде списков или таблиц, в которых содержится некоторая информация об анализируемом объекте. Обучение представляет собой простой подбор параметров модели, основанный на обучающей выборке. Задача классификации подразумевает, что прогнозируемая величина Y(t) принимает дискретные значения, которые предсказываются на основе значений некоторых факторов X1(t)… Xn(t). Геометрически задача классификации с бинарным откликом может быть интерпретирована следующим образом: обучающая выборка, состоящая из векторов (X1(t), …Xn(t)), где n - количество факторов, соответствует множеству точек в n-мерном конфигурационном пространстве (одно значение t соответствует одной точке). Например, если мы хотим, чтобы голос соседа имел тем больший вес, чем ближе он располагается относительно точки X(t), то мы можем . В простейшем случае разделяющая поверхность будет являться гиперплоскостью и может быть задана в виде: .