Постановка задачи и обзор университетских рейтингов. Оценка качества обучения. Программа для нахождения векторов файлов по ключевым словам. Основные элементы в формуле ранжирования. Наивный байесовский классификатор и метод k-ближайших соседей.
Аннотация к работе
В каждом из этих рейтингов, университеты оцениваются по разным критериям. Данный рейтинг учитывает в своей оценке такие критерии как: количество ссылок с других сайтов, общее количество страниц сайта, количество файлов, хранящихся в открытом доступе и количество размещенных на сайте статей и число их цитирований. В добавлении к недостаткам хочется заметить, что считается только количество файлов, расположенных на сайтах университетов, при этом не учитывается то, какие именно это файлы, другими словами, создатели этого рейтинга не рассматривают наполнение хранящихся документов. Рейтинг Times Higher Education World University Ranking оценивает университеты по множеству критериев, приведем основные: академическая репутация университета, включая научную деятельность и качество образования; научная репутация университета в определенных областях; общая цитируемость научных публикаций, нормализованная относительно разных областей исследований. При составление этого рейтинга, берутся в расчет только те университеты, чьи преподаватели или выпускники имеют Нобелевскую или Филдсовскую премию и/или публикуют в научных изданиях цитируемые научные исследования.В этом разделе будет подробно описана постановка задачи, а так же главные этапы решения задачи. Было решено взять 15 российских университетов для анализа наполнения их интернет-ресурсов. Вторая пятерка взята из середины рейтинга: · Омский государственный университет имени Ф.М. Для начала нужно скачать все документы с интернет-сайтов этих университетов. Обучив алгоритм на обучающей выборке и проверив на тестовой, уже можно на входные данные брать файлы из каждого университета в отдельности, а на выходные получать процент научных, учебных и администаривно-организационных документов для каждого университета.В этом разделе рассмотрим существующие рейтинги университетов.Times Higher Education World University Ranking 2013-2014 единственный рейтинг мировых университетов, который оценивает научные исследования под руководством учебных заведений во всех своих основных задачах - преподавательской, научной и в задаче передачи знаний. Создатели этого рейтинга используют 13 показателей эффективности, которые способны обеспечить наиболее полное и сбалансированное сравнение университетов. Эти 13 показателей были сгруппированы по пяти областям: 1. Университеты не входят в Times Higher Education World University Rankings, если они не обучают магистрантов; если они обучают только одной узкой специальности; или если количество их исследовательских статей составило менее 1000 публикаций в период между 2007 и 2011 (200 в год).Способность университета привлекать студентов, магистрантов, а так же и аспирантов со всех уголков планеты является залогом его успеха на мировой арене: этот фактор измеряется отношением иностранных к отечественным студентам и является 2,5% от общей оценки. Но доход имеет решающее значение для развития научных исследований мирового уровня, и исходя от этого, исследователи включили его в общую оценку. В общей оценке вес этого показателя составляет 6%. Имея вес 30% от общей оценки, он является самым влиятельным и значимым из всех 13 показателей и рассматривает роль университетов в распространении новых знаний и идей. Этот критерий оценивается путем подсчета количества цитирований работ, опубликованных университетом, учеными по всему миру.В этой главе будут рассмотрены вспомогательные программы, которые использовались для скачивания файлов с сайтов, а так же их дальнейшего анализа. Эта программа запускает до десяти одновременных потоков для скачивания файлов и страниц, дает доступ к защищенным паролем сайтам, фильтрует файлы по размеру и типу, произдовит поиск по ключевым слова, а так же делает многое другое. Главная особенность этой программы заключается в том, что она действительно ищет и находит все файлы, расположенные на сайте. Teleport Pro может: · Скачать весь или часть вебсайта на компьютер, что позволит просматривать сайт напрямую с жесткого диска на гораздо большей скорости, чем если бы просматривали сайт в режиме онлайн · Искать по сайту информацию либо файлы по ключевым словамSPSS Statistics - программный пакет используется для статистического анализа. Текущая версия (версия 2014 года) официально названа IBM SPSS Statistics. Сопутствующие продукты из той же семьи используются для исследования, разработки и внедрения технологий (IBM SPSS Data Collection), data mining (IBM SPSS Modeler). Название данного програмного обеспечения расшифровывается как Статистический пакет для социальных наук (Statistical Package for the Social Sciences, SPSS), хотя программное обеспечение теперь является популярным и в других областях, в том числе медицинских наук, маркетинга и анализа данных. Начиная с четырнадцатой версии, SPSS можно управлять с помощью Python или программы Visual Basic .NET, используя предоставленные плагины.Для решения данной задачи была необходимость написать программу, которая получая на вход N файлов типа doc и pdf, а так же k слов, на выходе выдавала
План
Содержание
Введение
Глава 1. Постановка задачи и обзор университетских рейтингов
1.1 Постановка задачи и основные этапы решения
1.2 Обзор некоторых университетских рейтингов
1.2.1 Times Higher Education World University Ranking
1.2.2 Webometrics
Глава 2. Вспомогательные программы
2.1 Teleport Pro
2.2 SPSS Statistics
2.3. Программа для нахождения векторов файлов по ключевым словам