rrimyuu 님의 블로그

ChatGPT 번역기 사용과 높은 표절률 본문

카테고리 없음

ChatGPT 번역기 사용과 높은 표절률

rrimyuu 2024. 6. 26. 15:53

 

한국어로 논문을 작성하고 ChatGPT 를 통해 영어로 번역을 했는데 표절률이 무려 60% 가 나왔다. GPT 킬러 (GPT 가 생성했다고 의심 받는 문장) 을 줄이기 위한 노력을 작성해보았습니다.  

 

1. ChatGPT 에 자세하게 명령을 해서 모든 문단을 다시 재구성 했습니다. 예를 들어서 "현재 표절률이 너무 높게 나오니 낮은 표절률을 목표로 academic sentences 로 작성해달라"고 했는데 오히려 표절률이 66% 로 증가했습니다.

 

2. Copilot 을 통해 모든 문단을 재구성해보았습니다. 이때도 명령문을 "현재 GPT 표절률이 높게 나오니 낮추는 방향으로 작성해달라"고 했습니다. 표절률은 59% 로 감소했지만 여전히 높은 표절률을 보였습니다. 

 

3. step 1, step 2 에서 카피킬러 돌렸을 때 표절이 아니라고 감지한 문장들만 추출해서 수정했습니다. 표절률은 여전. 

>> 이 때 발견한 것은 word 로 돌릴 때랑 pdf 로 돌릴 때랑 표절률이 다르게 나옵니다. word 가 더 높은 표절률로 측정됨. 

 

4. 인터넷에 찾아보니 ChatGPT 가 주로 사용하는 단어나 문장이 있다고 합니다. 조언대로 분사구문을 전부다 없애보았고,  due to -> owing to, without -> in the absence of 등 바꿀 수 있는 건 최대한 바꿔보았습니다. 이또한 ChatGPT 한테 추천해달라고 한 거긴 하지만... 어쨌든 여전한 표절률.  

 

5. 외국인 친구 A (영어 능통) 가 문단을 통째로 번역하지 말고 한 문장씩 번역하라고 조언을 해주었습니다. 표절률 동일. 

 

6. 외국인 친구 B (영어 능통) 가 구글 내 딕셔너리 보면서 (ChatGPT 참고 안함) 단어를 고치거나 문장 내 단어 순서를 바꿔보았습니다. 표절률 동일. 

 

7. ChatGPT 에 하소연 : ChatGPT 가 생성하는 문장을 잡아내는 사이트가 있다. 내 논문 대다수의 문장이 ChatGPT 가 생성한 것으로 의심되고 있다. ChatGPT 가 생성하는 문장에는 특유의 패턴이 존재하는 것 같다. 이 사이트에서 ChatGPT 가 생성한 것으로 의심 받지 않게/ 학술적으로 문장을 재구성해달라. 표절률 동일. 

 

8. 실험 

1) 지난 번에 (번역가 님에게) 돈 주고 맡겼던 다른 논문 번역본을 돌려보았음 ->  표절률 높음 (50% 대)

2) 현재 쓰고 있는 논문 한국어 버전 (ChatGPT 생성 일절 안함) 돌려보았음 ->  이전보다 표절률 더 상승 (65% ) 

3) google scholar 에서 아무 논문 골라 돌려보았음 -> 표절률 높음 (50% 대) 

 

9. 솔루션 없다는 결론... 솔루션을 알고 있다면 알려주시면 감사하겠습니다.