- 支持批量下载选手代码
- 支持序列相似度、TF-IDF相似度、变量相似度、函数相似度、结构相似度
- 支持结构化显示,查询指定用户信息
- 支持识别并标记特殊关键词(如注释、freopen)
- 支持展示抄袭关系网
parse_records.py 将导出的html成绩表转换为csv格式
download_codes_auto.py 根据csv格式的成绩表下载选手代码(需填写cookie)
plagiarism_detector.py [比赛名] 计算相似度并导出数据
- 下载代码并安装依赖
- 在已经完成的比赛页面点击比赛成绩表->导出为html
- 将下载的html文件放在同目录并改名为
reports.html
- 运行
parse_records.py
转换格式 - 运行
download_codes_auto.py
爬取选手代码并设定比赛名称 - 运行
plagiarism_detector.py [比赛名]
进行反作弊检查 - 打开可视化链接并上传
result/[比赛名]/[比赛名]_plagiarism_data.json
- 报告生成在
result/[比赛名]/[比赛名]_plagiarism_report.txt
本系统由jiangmuran开发,采用mit开源协议,任何对于此系统的使用、修改、分享均需注明原作者信息。本人不承担任何使用此系统的后果及法律责任。作者不认可任何可能窃取、使用他人隐私信息的行为。未授权使用此系统的爬虫部分可能会被视为网络攻击,请确保已获得系统运营者和所有参赛选手的许可。