ChatGPT, Claude, Gemini가 만들어내는 한국어 글은 2024년 이후 빠르게 자연스러워졌습니다. 단순한 "AI 글 같다"는 직관만으로는 더 이상 판별이 어렵고, 판별기의 신뢰도 역시 완벽하지 않습니다. 2023년 스탠퍼드 연구(Liang et al.)는 비원어민이 쓴 영문 에세이가 AI로 잘못 판정되는 비율이 50%를 넘었다고 보고했고, 한국어처럼 자료가 상대적으로 적은 언어에서는 오탐 위험이 더 큽니다.
이 글은 두 가지를 함께 다룹니다. 사람이 직접 알아볼 수 있는 다섯 가지 신호, 그리고 자동 판별기 네 가지의 실제 사용 맥락. 둘을 합쳐 보아야 오판 위험을 줄일 수 있습니다.
사람이 먼저 확인할 5가지 신호
균일한 문장 길이
사람은 짧고 긴 문장을 섞어 쓰지만, LLM은 비슷한 길이의 문장을 연속해서 생성하는 경향이 있음. 학술 용어로 'low burstiness'.
반복되는 연결 표현
'먼저', '또한', '결론적으로', '살펴보겠습니다' 같은 정형화된 전환구가 한 글에 반복적으로 등장.
추상적·일반론적 결론
구체적 사례나 개인 경험이 빠지고, '다양한 측면에서 중요하다' 같은 무난한 마무리로 끝나는 경향.
사실 오류(할루시네이션)
존재하지 않는 논문·인용·통계가 자연스러운 문체로 섞임. AI 글에서 가장 위험한 특징. 모든 인용을 별도로 검증할 필요.
맞춤법은 완벽한데 어감이 어색
한국어 LLM 글은 문법 오류가 거의 없지만 '한국인은 잘 쓰지 않는 어순'이 종종 나타남. 번역체에 가까운 인상.
한국어 처리가 되는 판별기 비교
GPTZero
영문 기반이지만 한국어 입력도 처리. 문장 단위 확률을 보여줘 혼합 문서 판별에 유리.
Copyleaks AI Detector
다국어 지원이 비교적 강하며 기업용 워크플로우 통합 옵션. 무료 데모 제공.
ZeroGPT
무료, 회원가입 없음. 다만 한국어 정확도는 영어 대비 떨어진다는 사용자 리포트가 다수.
Originality.ai
유료 전용. 표절·AI·팩트체크를 묶어 콘텐츠 제작사 워크플로우에 적합.
학교에서의 활용 — 주의할 점
AI 판별기 점수만으로 학생을 처벌하는 것은 권장되지 않습니다. OpenAI 자체도 2023년 자사 AI 분류기를 "정확도가 낮다"는 이유로 중단했고, 대학들도 판별기 점수를 "대화의 출발점"으로만 다루기 시작했습니다. 의심되는 글은 (1) 작성 과정 인터뷰, (2) 초고 히스토리 확인, (3) 두 개 이상 판별기 결과 교차 비교의 순으로 검증하는 것이 안전합니다.
기업·언론에서의 활용
외주 콘텐츠 검수, 보도자료 검증, LLM 출력의 사실 확인 단계에서는 "AI 판별 + 팩트체크"를 묶는 것이 효과적입니다. 판별기는 "어떻게 쓰여졌는가"를 알려주고, FAXTR 같은 팩트체크 플랫폼은 "안에 담긴 주장이 사실인가"를 알려줍니다. 둘은 다른 질문이며, 둘 다 필요합니다.