PDF v1.2 요구사항 반영 완료: - 10종 법령 메타 태그 + 39개 케이스 분류체계 - 3단 캐스케이딩: MinHash+LSH → 삼중 유사도 → 분류 - 자서전 특화: 공통 표현 사전 제거 + NER 마스킹 - KoSimCSE 한국어 임베딩 (자체 산출물 방어) - 보수적 임계값 0.85 - 검토 콘솔 UI (탐지 + 코퍼스 관리 탭) - Docker 배포 패키지 + 31개 테스트 통과 |
||
|---|---|---|
| .. | ||
| evaluate_o2o_dataset.py | ||
| evaluate_pairs.py | ||
| generate_plagiarism_pairs.py | ||
| sample_curl.sh | ||
| sample_python.py | ||
| visualize_eval.py | ||