Результаты исследований по обнаружению заимствований с использованием анализа цитирований

Вадим Николаевич Гуреев, Николай Алексеевич Мазов

Аннотация


Переводной плагиат как одна из наиболее распространенных в научном информационном пространстве разновидностей плагиата представляет собой трудноразрешимую проблему, поскольку практически не поддается автоматизированному выявлению. Между тем за последние пять лет в этом направлении наблюдается прогресс. Авторами настоящей работы, а также группой зарубежных исследователей из нескольких университетов независимо друг от друга был предложен подход к выявлению плагиата на основе анализа цитирований, при котором для анализируемой подозрительной публикации находится возможный первоисточник с идентичным или схожим списком цитируемой литературы, что в итоге позволяет сличать текст на разных языках. Разработанная методика обнаружения неправомерных заимствований в научных текстах успешно прошла тестовые исследования. В статье приведены результаты четырехлетних исследований.


Ключевые слова


обнаружение заимствований; переводной плагиат; выявление плагиата; анализ цитирования; база данных цитирований

Полный текст:

PDF

Литература


Mazov N.A., Gureev V.N., Kosyakov D.V. On the development of a plagiarism detection model based on citation analysis using a bibliographic database // Scientific and Technical Information Processing. 2016. V. 43, No 4. P. 236‒240.

Gureev V.N., Mazov N.A. Citation analysis as a basis for the development of an additional module in antiplagiarism systems // Scientific and Technical Information Processing. 2013. V. 40, No 4. P. 264–267.

Мазов Н.А., Гуреев В.Н. К вопросу о разработке моделей выявления плагиата на основе цитирования с использованием наукометрических баз данных // Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса: Труды 23-й Международной конференции «Крым-2016» (4–12 июня 2016 г., Судак). М.: Изд-во ГПНТБ России, 2016. С. 1–4.

Gipp B., Meuschke N., Breitinger C., Lipinski M., Nürnberger A. Demonstration of citation pattern analysis for plagiarism detection // 36-th International ACM SIGIR Conference on Research and Development in Information Retrieval, SIGIR 2013 (July 28 – August 01, 2013, Dublin, Ireland). New York: ACM, 2013.P. 1119–1120.

Meuschke N., Gipp B. Reducing computational effort for plagiarism detection by using citation characteristics to limit retrieval space // Proceedings of the ACM/IEEE Joint Conference on Digital Libraries, 2014. P. 197‒200. Doi: 10.1109/JCDL.2014.6970168.

Gipp B., Meuschke N., Breitinger C., Pitman J., Nürnberger A. Web-based demonstration of semantic similarity detection using citation pattern visualization for a cross language plagiarism case // ICEIS 2014. Proceedings of the 16th International Conference on Enterprise Information Systems. 2014, V. 2, P. 677‒683.

Gipp B., Meuschke N. Citation Pattern Matching Algorithms for Citation-based Plagiarism Detection: Greedy Citation Tiling, Citation Chunking and Longest Common Citation Sequence // Proceedings of the 11-th ACM symposium on Document engineering (DocEng '11) (19–22 September, 2011, Mountain View, USA). New York: ACM, 2011. P. 1–10.

Kessler M.M. An Experimental Study of Bibliographic Coupling Between Technical Papers // IEEE Transactions on Information Theory. 1963. V. 9, No 1. P. 49–51.

Kessler M.M. Comparison of the results of bibliographic coupling and analytic subject indexing // American Documentation. 1965. V. 16, No 3. P. 223–233.

Осипов Г.С., Смирнов И.В., Тихомиров И.А., Соченков И.В., Зубарев Д.В., Исаков В.А. Технологии семантического поиска заимствований в научных текстах // Труды 23-й Международной конференции «Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса» (4–12 июня 2016 г., г. Судак). М. : ГПНТБ России, 2016. C. 1–3.

Sochenkov I., Zubarev D., Tikhomirov I., Smirnov I., Shelmanov A., Suvorov R., Osipov G. Exactus Like: Plagiarism Detection in Scientific Texts // Advances in Information Retrieval: 38th European Conference on IR Research, ECIR 2016 (March 20–23, 2016, Padua, Italy). Cham: Springer International Publishing, 2016. P. 837–840.