Какие правильные шаги следует предпринять, чтобы обнаружить плагиат между 2 файлами?
я последний год учусь в Bca stuent, и мой проект-это обнаружение плагиата между 2 файлами .и я читал исследовательские работы по обнаружению плагиата, и я схожу с ума, делая это ... потому что есть много и разнообразие шагов, которые можно предпринять, и разнообразие алгоритмов, которые можно использовать. нет никакой конкретной статьи, которая давала бы подробное описание этого обнаружения плагиата..пожалуйста, помогите мне (я планирую использовать java и MySQL для базы данных)
Что я уже пробовал:
согласно информации, которую я получил из статьи, я попытался разбить абзац на предложения и подсчитать частоту ключевых слов... и я потерял представление о том, что именно нужно делать ...я все это делал на java