Розгляд оцінки якості даних, отриманих з різних джерел. Аналіз розробки алгоритму визначення релевантності відповіді користувачу. Сутність формулювання відповідності прийнятого рішення еталонному. Синтез результатів консолідації текстової інформації.
Тестування, надійність та якість програмНа рівні задач, для яких використовується точкове джерело, якість даних цього джерела є достатньою, і задовольняє (повністю чи частково) потреби осіб, що приймають рішення на їх основі. Під оцінюванням якості даних розумітимемо процес компонування даних, очищення та вдосконалення даних, а також обєднання з усуненням дублювання та невизначеності. Реалізовані в сучасних серверах баз даних засоби аналізу та видобування даних (MS Analysis Server, Oracle Analytics тощо) не дають змоги враховувати наявність шуму, що, у свою чергу, породжує формування помилкових залежностей даних. Особливо ця проблема загострюється тоді, коли дані надходять з різних джерел, у то-му числі і неструктурованих. Коректність або достовірність даних - це ступінь відповідності даних про обєкти в базах даних реальним обєктам у даний момент часу, що визначається змінами самих обєктів чи їх характеристик.У статті проаналізовано методи визначення якості даних. Наукова новизна: розроблено метод визначення якості консолідованих даних на основі формалізації стандарту ISO 9126, що уможливило визначати придатність цих даних для подальшого прийняття рішень. Практична цінність: розроблено засоби консолідації структурованих і неструктурованих даних та визначення їх якості, що дало змогу підвищити релевантність знайдених даних. Чим більше анкет проаналізовано, тим точнішим є результат пошуку. Усунення невизначеності даних відбувається в сховищі консолідованих даних шляхом руху мережею записів.
Вывод
У статті проаналізовано методи визначення якості даних. Наукова новизна: розроблено метод визначення якості консолідованих даних на основі формалізації стандарту ISO 9126, що уможливило визначати придатність цих даних для подальшого прийняття рішень.
Практична цінність: розроблено засоби консолідації структурованих і неструктурованих даних та визначення їх якості, що дало змогу підвищити релевантність знайдених даних.
Таблиця 3. Результати консолідації текстових даних
Кіль- правильно частково неправиль-визначе- визначених но визначе-
% % % trial анкет них анкет анкет них анкет
12 0,50 0,25 0,25
56 0,57 0,27 0,16
128 0,62 0,23 0,16
289 0,73 0,16 0,10
587 0,77 0,15 0,09
Чим більше анкет проаналізовано, тим точнішим є результат пошуку. Усунення невизначеності даних відбувається в сховищі консолідованих даних шляхом руху мережею записів. Аналіз результатів пошуку даних у джерелах наведено у табл. 4.
1. Christensson K. RADCAB- 2007. - http://www.radcab.com/about.html.
2. Ciolek T.M. Digitising Data on Eurasian Trade Routes: An Experimental Notation System - 2000. - www.ciolek.com/PAPERS /pnc-berkeley-02.html.
3. Standler R.B., «Equations for Some Transient Overvoltage Test Waveforms System - 2004. -http://www.eeel.nist.gov/817/pubs/spd-anthology/files/Citations Part 4.doc
4. Borisova E. Index method of quality of the integrated complex objects - 1999. - http://www.mce.su/archive/doc15498/doc.pdf (in Russian).
5. Koval H. Models and methods of engineering quality software systems at the early stages of the life cycle: Kyiv: Kyiv national university Press, 2005 - 24 p.
6. Zgurovskiy M., Pankratova N. Basis of system analisys. - Kyiv: BHV, 2007. - 544 p. (in Ukranian).
7. Sovovjova K. Systemic and mathematical principles of natural classification and their use in intelligent systems. - Kharkov: Kharkov university of radioelectronics Press, 1999. - 34 p. (in Ukrainian).
46
8. Aphonichkin A., Panphiloff A. The quality of information provision in the management // Saratov: Saratov University Press, 1988. - 175 p. (in Russian).
9. Shakhovska N. Algebraic system of dataspace // Proc. of International Conference on Intellectual Systems for Decision Making and Problems of Computational Intelligence «ISDMCI’2011», 16-20 May 2011, Yevpatoria. - Vol. 1. - Kherson, 2011. - P. 14-18.
Одержано 10.06.2014
Тестування, надійність та якість програм
Про автора: Шаховська Наталія Богданівна, доктор технічних наук, доцент, професор кафедри інформаційних систем та мереж.
Місце роботи автора: Національний університет «Львівська політехніка», м. Львів, вул. С. Бандери, 28. Тел.: (032) 258 2404.
Е-mail: natalya233@gmail.com
47
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы