Дослідження засобів контролю присутності запозичень у текстових документах та створення програмного забезпечення для електронних бібліотек регіональних навчальних закладів - Магистерская работа

бесплатно 0
4.5 325
Проблема порушення авторських прав в Інтернеті. Системи та сервіси пошуку плагіату. Захист електронних видань від плагіату в Інтернеті. Алгоритми аналізу, подання і порівняння текстової інформації. Вибір методу пошуку текстових документів з запозиченнями.

Скачать работу Скачать уникальную работу

Чтобы скачать работу, Вы должны пройти проверку:


Аннотация к работе
Завдяки тому, що в глобальній мережі Інтернет опубліковані, в деяких випадках незаконно, багато електронні видання, а також в силу незнання чинного законодавства в галузі авторського права, багато хто вважає можливим копіювати фрагменти опублікованих у мережі Інтернет електронних видань, з подальшим присвоєнням авторства. За даними, опублікованими Education Week (http://www.plagiarism.org/plagiarismstats.html), заснованим на національному дослідженні (USA) випливає, що 54% студентів незаконно використовують у своїх роботах матеріали, опубліковані в мережі Інтернет. Актуальність дослідження полягає в необхідності створення методів та автоматизованого інструментарію, що дозволяють здійснювати ефективний і адекватний пошук запозичень в текстових документах, розміщених в електронній бібліотеці регіональних навчальних закладах. Метою магістерської роботи є створення автоматизованої системи, а також розробка методів і алгоритмів, що дозволяють проводити пошук запозичень в текстовій інформації, розміщених в електронній бібліотеці регіональних навчальних закладах. Для досягнення мети були вирішені наступні завдання: огляд програмних систем, що дозволяють проводити пошук запозичень в мережі Інтернет;Авторське право в сучасному сенсі було встановлено лише підчасів епохи Просвітництва, Батьківщиною першого авторського і патентного законодавства вважається Великобританія, де в 1710 році зявився перший авторський закон, відомий як "Статус королеви Анни" і містив один з найважливіших принципів авторського права - "копірайт". Основною метою такого правового регулювання був захист інтересів видавця, але здійснювалася вона за допомогою законодавчої конструкції, що спиралася на волевиявлення учасника, якому надавалося монопольне право на публікацію твору протягом 14 років з моменту його створення, а також можливість продовження цього терміну ще на 14 років при життя автора. Характерно, що на автора покладалася "зустрічна обовязок" - надавати в публічно доступні бібліотеки кілька примірників своїх творів. Авторське право розглядалося не з майновою боку, а як продовження і відображення особистості самого автора, у звязку з чим останній набував чинності "природною справедливості" права на охорону свого твору у якості частини своєї особистості. [11] В даний час Кримінальний кодекс України визначення плагіату не містить, звертаємося до статті 50 Закону України "Щодо авторське право та суміжні права": плагіат - оприлюднення (опублікування), повністю або частково, чужого твору під іменем особи, яка не є автором цього добутку.Відразу після створення твору автору належать права двох видів: приватні немайнові права і майнові права. Для виникнення і шляхи виконання авторського права не потрібно реєстрації твору, іншого спеціального оформлення твору або дотримання будь-яких формальностей [13]. Особисті немайнові права (право визнаватися автором; право оприлюднити або дозволяти оприлюднити твір; право на захист твору) належать автору незалежно від його майнових прав і зберігаються за ним у разі поступки виключних прав на використання твору. До майнових прав, що належить автору, відносяться винятково права на використання твору в будь-якій формі та в будь способом. Таким чином, порушення авторських прав в глобальній мережі Інтернет можна розділити на дві категорії: Порушення особистих немайнових прав - привласнення авторства на розміщені в Інтернеті твори, тобто плагіатНе всі країни поспішають впроваджувати на національному рівні проекти з запобігання розповсюдження плагіату. Так за словами авторів програми з автоматичного пошуку плагіату в мережі Інтернет, Анатолія Шевченка та Олександра Литвиненка: у Міністерстві освіти і науки України знають про "ноу-хау" і дали добро на його впровадження.У більшості випадків, після отримання аргументованого листа про порушення авторських прав, власники сайту (адміністратори) приносять вибачення і припиняють порушення. Однак, якщо порушення авторських прав триває, то можливе звернення до власників хостингу, з проханням припинити доступ до ресурсу, що порушує законодавство України. При цьому необхідно детально описати, чиї права були порушені, ким і коли, яким законодавством це порушення переслідується, яка відповідальність загрожує власникам сайту-порушника. Якщо хостинг належить іноземної організації, то при мотивуванні порушення необхідно посилатися на норми міжнародних конвенцій з авторського права та інтелектуальної власності: Бернська конвенція про охорону літературних і художніх творів 1886 року (у редакції, підписаної в Парижі 24.07.71 р.)EVE2 приймає документи у текстовій форматі Microsoft Word, або форматі Corel Word Perfect і повертає посилання на web-сторінки, з яких студент, можливо, скопіював матеріали. POWERRESEARCHER - це система, що дозволяє проводити пошук плагіату для не дуже великих фрагментів текстового матеріалу. Однак необхідно відзначити, що система не виробляє пошуку по глобальній мережі Інтернет. Дана система дозволяє

План
Зміст

Реферат

Перелік скорочень

Вступ

Розділ 1. Аналіз стану питання і постановка задач дослідження

1.1 Витоки авторського права і відповідальності за його порушення

1.2 Види порушення авторських прав

1.3 Проблема порушення авторських прав

1.4 Дії щодо припинення порушення авторських прав

1.5 Огляд систем і сервісів пошуку плагіату

1.6 Способи захисту електронних видань від плагіату в Інтернеті

1.6.1 Електронне видання

1.6.2 Види текстової інформації

1.6.3 Способи захисту

1.7 Автоматизація обробки текстової інформації

1.8 Постановка завдання

Розділ 2. Методи і алгоритми аналізу, подання і порівняння текстової інформації

2.1 Методи аналізу текстової інформації

2.2 Методи захисту від копіювання текстової інформації в Інтернеті

2.3 Алгоритми пошуку точного збігу

2.4 Алгоритми пошуку спільних підпослідовностей

2.6 Алгоритми обчислення відстані між рядками

2.7 Алгоритми нечіткого пошуку

Розділ 3. Вибір методу пошуку текстових документів з запозиченнями

3.1 Локальні методи

3.1.1 LONGSENT

3.1.2 Методи на основі заходи TF

3.1.3 Методи, які використовують поняття шинглів

3.1.4 MINHASH метод

3.1.5 Методи, які використовують семантичні мережі

3.2 Глобальні методи

3.2.1 Методи на основі з TF-IDF

3.2.2 I-Match метод

3.2.3 Метод опорних слів

3.3 Порівняння методів знаходження нечітких дублікатів

Розділ 4. Розробка програмного забезпечення

4.1 Етап роботи алгоритму шинглів для веб-документів

4.1 Обгрунтування вибору засобів розробки

4.3 Реалізація алгоритму шинглів

4.4 Інтерфейс взаємодії з користувачем

Розділ 5. Охорона праці та безпека в надзвичайних ситуаціях

Висновки

Список літератури

Додатки

Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность
своей работы


Новые загруженные работы

Дисциплины научных работ





Хотите, перезвоним вам?