Разработка программного обеспечения, позволяющего автоматизировать подсчет метрик отражающих "почерк создателя" программного обеспечения для исходных кодов программ и профиля для достоверного осуществления идентификации автора программного обеспечения.
Сравнивая количество появлений различных N-грамм в авторских и спорных текстах, создатели метода смогли добиться убедительных результатов, когда точность определения авторства составляет порядка 90% и больше. Однако, этот метод имеет один существенный недостаток, заключающийся в том, что основные элементы данного метода открыты для субъективных манипуляций, то есть зная частоту встречаемости N-грамм какого либо автора, легко подделать его стиль. Поэтому целью настоящей работы является по-строение метрик, максимально адаптированных под особенности любых языков программирования, и сосредоточенных, в основном, на индивидуальной манере написания программ разными авторами. С помощью данной метрики можно выявить служебные слова, чаще всего используемые программистом. Так, например, существуют взаимозаменяемые ключевые слова и составленные с их помощью операторы, использование которых не меняет логику работы программы (if/else могут заменяться на switch/case или оператор for на оператор while).Эти особенности образуют так называемый «профиль» автора, который может быть выражен в числовом виде. Особенностью предложенной методики является возможность регулярного уточнения профиля автора на основе подсчета метрик тех программных продуктов, для которых его авторство установлено достоверно. Перспективным направлением дальнейших исследований является разработка аналогичной методики для так называемых «байт-кодов» («р-кодов») программ, написанных на Java, Java-script и других подобных языках. Identifying Authorship by Byte-Level N-Grams: The Source Code Author Profile (SCAP) Method [Electronic resource] / G.
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы