Процесс управления большими данными (БД). Формулирование определения проекта управления БД. Формирование списка бизнес-задач в проектах управления БД. Анализ российского и международного рынков решений в области БД. Классификация проектов управления БД.
Стратегическое управление большими массивами данных, в первую очередь, предполагает уход от традиционных способов организации корпоративных хранилищ к логической структуре систем хранения данных, позже, в 2015 году, фокус в области развития технологий БД смещается на использование результатов аналитики, построенной на собранной информации, что становится основой таких направлений как: продвинутая аналитика, интернет вещей, контекстно-зависимые системы. Вместе с тем, инвестиции в решения БД продолжают расти: количество компаний, заинтересованных (уже инвестируют или планируют инвестиции в ближайшее время) во внедрении решений в области БД выросло с 64% в 2013 году до 73% в 2014 году, также согласно опросу, проведенному компанией Gartner, и по прогнозу аналитической компании IDC расходы на эту сферу будут уверенно увеличиваться. Согласно отчету Capgemini, неудачи проектов использования "больших данные" большей частью были связаны с высокой долей разброса данных среди систем и хранилищ компаний; плохо поставленными целями и задачами; недостатком профессиональных знаний, то также отразилось на отсутствии предварительного планирования хода реализации проектов. Большой отклик данная тема нашла среди профессионалов российского ИТ-рынка - представители российского ИТ-сообщества (сотрудники крупных вендоров решений БД - IBM, Sap, Oracle, Teradata, ЕМС, а также российских интеграторов: IBS, Ланит) говорят о тенденциях развития Больших данных на основе мировой статистики, делятся экспертным мнением о готовности компаний внедрять и использовать подобные решения в России, а также предполагают основные препятствия, связанные с бурным развитие проектов БД. Информация о проектах, деталях их реализации и полученных результатах собрана из открытых источников: основные и дополнительные сайты вендоров устанавливаемых решений, так, например, по проектам компании SAP помимо основного официального сайта вендора sap. com, также оказались информативными ресурсы: sapplanet.ru, sapland.ru и т.п.; презентации для клиентов и партнеров, материалы интеграторов и консалтинговых компаний, участвовавших во внедрении решений, в том числе представленные на различных конференциях ("Большие Данные в национальной экономике" в 2013г.; "Big Data Russia", круглый стол "Большие данные: тренд новых ИТ" в 2014г.).Согласно словарю, большие данные - это данные таких значительных размеров, при которых их обработка и управление такими данными представляют технические проблемы для существующих систем (ориг.: "big data is a data of a very large size, typically to the extent that its manipulation and management present significant logistical challenges"). Идею о том, что при определении "больших данных", не стоит ограничивать размеры информации точными численными значениями, поддерживается также в одной из популярнейших книг, посвященной исследованию больших данных - "Большие данные. Авторы отмечают, что не существует единого строго определения БД, при этом в рамках одиного из подходов, рассматриваемых в книге, понятие "больших данных" относится к операциям, которые можно выполнять исключительно в большом масштабе, т.е. в основе БД лежит понимание того, что с ними можно сделать и почему размер данных имеет значение: "…things one can do at a large scale that cannot be done at a smaller one, to extract new insights or create new forms of value." В книге также подчеркивается важность корреляций, которые могут быть обнаружены благодаря аналитике БД, и которые, возможно, в корне поменяют понимание причинности рассматриваемых процессов. Так ведущий вендор решений Big Data - компания SAP - определяет большие данные как "группу технологий и методов производительной обработки динамически растущих объемов данных (структурированных и неструктурированный) в распределенных информационных системах, обеспечивающих организацию качественно новой полезной информацией" [презентация САП]. На конференции "Большие данные и бизнес-аналитика 2012" в докладе менеджера по исследованиям IDC Александра Прохорова к классическому определению было добавлено четвертое V - Value (ценность) и числовые оценки характеристик больших данных: объем БД не менее 100 Тбайт; скорость представлена двумя видами - это скорость захвата и обработки данных в режиме реального времени более 60Гбит/с и скорость накапливания информации более 10% в год (такие значения характеризуют ситуацию, при которой объем накопленных данных велик, но расширение возможностей существующей ИТ-инфраструктуры будет экономически нецелесообразно - в такой ситуации рекомендуется рассмотреть переход на технологии Big Data); вариативность или разнообразие данных означает сбор данных либо из разных источников, либо данных разных форматов.Управление большими данными (Big Data Management) - понятие, складывающееся из понимания "больших данных" и "управления данными": в предыдущем разделе определено то, что понимае
План
Оглавление
Введение
Глава 1. Анализ основных понятий предмета исследования
1.1 Определение понятия больших данных (БД)
1.2 Анализ процесса управления большими данными
1.3 Формулирование определения проекта управления БД
Глава 2. Формирование списка бизнес-задач в проектах управления БД
2.1 Анализ российского и международного рынков решений в области БД
2.2 Исследование ограничителей роста российского и международного рынков решений в области БД
Раздел 3. Разработка рекомендаций по постановке задач к проектам управления БД
3.1 Формирование списка проектов управления БД
3.2 Классификация проектов управления БД и задач в проектах
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы