Может ли технология блокчейна изменить обнаружение плагиата в академических кругах?

Может ли технология блокчейна изменить обнаружение плагиата в академических кругах?

5 декабря 2022 г.

Поскольку повальное увлечение блокчейном не собирается прекращаться, мы начинаем видеть все больше и больше предложений по применению этой технологии в академических условиях. На самом деле университеты уже использовали блокчейн для изменения или замены нескольких важных процессов. Некоторые учебные заведения в США, например, решили выпустить невзаимозаменяемые токены (NFT) для подтверждения подлинности своих дипломов и онлайн-сертификатов.

Но как насчет академического письма? Может ли блокчейн действительно изменить то, как студенты подходят к написанию и отправке своих заданий? В этой статье мы намерены выяснить, как технология блокчейна может изменить обнаружение плагиата в современных академических кругах.

Каков основной подход к обнаружению плагиата?

На данный момент обнаружение плагиата является частью так называемой обработки естественного языка (NLP). Проще говоря, НЛП включает в себя использование алгоритмов и программных средств для разбора и анализа текста, написанного людьми.

Обычно алгоритм НЛП делит текст на слова, предложения и абзацы. Используя встроенные словари и лингвистические метаданные, такой алгоритм также может присваивать значения словам и определять ключевые семантические компоненты фраз и предложений. При необходимости автоматические инструменты также могут идентифицировать уникальные лингвистические «отпечатки пальцев< /strong>", включая часто встречающиеся слова или фразы, общий тон конкретного документа или сложные семантические сети.

Оттуда инструмент обнаружения плагиата сканирует другие документы, доступные в его предварительно загруженной базе данных. Как правило, эти базы данных включают академические работы других студентов, эмпирические статьи и другие материалы, на которые можно сослаться в типичном эссе или диссертации. Базы данных, используемые программным обеспечением для обнаружения плагиата, постоянно обновляются алгоритмами «краулера», которые регулярно ищут новый релевантный контент.

После этого инструменты обнаружения плагиата обычно могут выводить числовой рейтинг (обычно измеряемый в процентах), свидетельствующий об оригинальности данной работы. Программное обеспечение также может выделять определенные фразы или предложения, которые дословно заимствованы из других работ, без надлежащего цитирования. В целом текущий подход к обнаружению плагиата точен и надежен, что позволяет университетам обрабатывать большие объемы текстовых данных, допуская при этом мало ошибок при оценке плагиата.

Так зачем же университетам переходить на алгоритм на базе блокчейна? Во-первых, может быть довольно сложно обнаружить «недословный» плагиат. Если учащийся умеет переписывать или находить синонимы, иногда он может обмануть несколько существующих детекторов плагиата (хотя это не данность). Кроме того, средства проверки на плагиат могут давать «ложные срабатывания». Наконец, без действительной временной метки невозможно определить, кто у кого скопировал, что создает возможную «лазейку» для тех, кто обвиняется в плагиате.

Кроме того, результаты проверки на плагиат могут быть трудно аутентифицированы. Что делать, если база данных, используемая для обнаружения плагиата, устарела или неточна? Академические тексты постоянно меняются путем повторной подачи и пересмотра. Или что, если автоматический веб-краулер решит добавить ошибочные или нерелевантные текстовые данные? Это значительно снизит точность проверки на плагиат и, возможно, увеличит количество «ложных срабатываний», сообщаемых инструментами оценки плагиата.

Как можно интегрировать блокчейн в систему обнаружения плагиата?

Чтобы ответить на этот вопрос, давайте кратко определим, что такое блокчейн. По сути, блокчейн — это цифровая книга, в которой каждая запись неизменяема. . Когда запись добавляется в базу данных блокчейна, она содержит хэш-данные всех предыдущих узлов в реестре, а это означает, что ее нельзя изменить, что бы вы ни делали.

Таким образом, блокчейн на самом деле не предлагает альтернативы НЛП. Например, эту технологию нельзя использовать для повышения точности обнаружения «недословного» плагиата. Однако, по нашему мнению, блокчейн может предложить ценную альтернативу традиционным базам данных, используемым наборами для оценки плагиата. Как? Рассмотрим несколько кратких примеров.

Например, представьте ситуацию, когда академический текст добавляется в базу данных блокчейна как запись, включая временную метку и информацию об авторстве. С этого момента его нельзя удалить или изменить каким-либо образом. Само его существование в реестре блокчейнов подтверждает подлинность как времени его отправки, так и его метаданных.

Это означает, что блокчейн устраняет «лазейку» временных меток, которую мы описали выше. В системе на основе блокчейна определить, кто у кого скопировал, легко, поскольку все тексты снабжены подлинными временными метками. Другими словами, размещение академических текстов в блокчейне позволяет алгоритмам обнаружения плагиата делать достоверные заявления о точности своих результатов без непосредственного контроля со стороны человека.

Теоретически блокчейн также устраняет проблему контроля версий, о которой мы упоминали в предыдущем разделе. Если все действительные версии эмпирической статьи или учебника хранятся в блокчейне, «сканерам» не нужно постоянно расширять свои базы данных. Вместо этого все проверки на плагиат будут проводиться на основе достоверных и актуальных данных, что значительно сократит количество «ложных срабатываний» и положительно повлияет на академическую честность различных университетов.

В то время как технология блокчейна предлагает значительные преимущества для университетов, в ее реализации также много неизвестного. Во-первых, до сих пор никто не использовал регистры блокчейна для хранения больших объемов академических текстовых данных. Более того, ни одна из существующих программ проверки на плагиат не связана с базой данных на базе блокчейна. В результате немного сложно спрогнозировать затраты, которые могут быть понесены при использовании блокчейна для обнаружения плагиата.

Блокчейн также представляет собой крайне нерегулируемое пространство, тесно не связанное с какими-либо правовыми положениями. Впоследствии широкомасштабное внедрение блокчейна респектабельными академическими учреждениями может столкнуться с серьезным сопротивлением со стороны тех, кто не доверяет этой технологии. Также неясно, как именно изменится блокчейн в течение следующих пяти лет, что создаст еще одну трудность для ученых, желающих поэкспериментировать с использованием этих цифровых реестров.

Блокчейн не является метафорической панацеей от проблем современного обнаружения плагиата. Например, использование децентрализованных цифровых реестров никак не способствует устранению «недословного» плагиата. Тем не менее, технология блокчейна предлагает некоторые интересные решения для временных меток и аутентификации базы данных. Мы надеемся, что университеты заметят это и приложат реальные усилия, чтобы сделать блокчейн более доступным для регулярно выполняемых академических задач.

н


Оригинал