챗GPT vs 딥시크: 2025 수능 AI 대결, 승자는?

최근 AI 기술이 급격히 발전하면서, 인공지능이 인간의 사고 능력을 얼마나 따라올 수 있을지가 뜨거운 관심사로 떠오르고 있습니다. 특히 논리적 사고력과 언어 이해력이 중요한 한국 수능 시험에서 AI가 어떤 성과를 낼 수 있을지 궁금해하는 사람들이 많죠.

이런 궁금증을 풀기 위해 JTBC 취재진이 챗GPT와 중국 AI 모델인 ‘딥시크(DeepSeek)’에게 2025학년도 수능 국어·수학 공통과목 시험을 풀게 하는 실험을 진행했는데요. 그 결과가 상당히 흥미롭습니다. 과연 어느 AI가 더 뛰어난 성적을 거두었을까요? 그리고 AI는 수능 문제를 풀면서 어떤 유형에서 어려움을 겪었을까요?

챗GPT vs 딥시크, 2025 수능 성적 비교

JTBC의 실험 결과, 챗GPT가 국어·수학 시험에서 더 높은 점수를 기록하며 승자로 판정되었습니다. 하지만 두 AI 모두 수험생들이 자주 틀리는 문제 유형에서 비슷한 실수를 범하는 모습도 보였죠.

1. 국어 영역 – AI도 ‘적절하지 않은 것’ 유형에 약했다

국어 시험에서는 ‘가장 적절한 것’ 또는 ‘적절하지 않은 것’을 고르는 문제가 특히 어렵게 출제되곤 합니다. 수험생들도 헷갈려하는 유형인데, AI 역시 정답률이 낮았습니다. 이는 AI가 문맥을 완전히 이해하는 데 한계를 가지고 있다는 점을 보여줍니다.

2. 딥시크, 한국 전통 시조 문제에서 더 강했다

흥미로운 점은 딥시크가 한국 시조와 관련된 문제에서 챗GPT보다 높은 점수를 기록했다는 사실인데요. 전문가들은 딥시크가 중국 및 아시아 문화권의 데이터를 더 많이 학습했기 때문에 한국 전통 문학과 관련된 내용을 더 잘 이해했을 가능성이 높다고 분석했습니다.

3. 챗GPT 업그레이드 버전, 수학 성적 상승 vs 국어 성적 하락

새롭게 공개된 챗GPT o3 미니 하이 버전도 동일한 시험을 치렀는데, 수학에서는 오답률이 줄어든 반면, 국어 성적은 오히려 하락하는 결과를 보였습니다. 이는 AI 모델이 특정 영역의 성능을 개선할 때 다른 영역에서의 성능이 상대적으로 저하될 수 있음을 보여주는 사례죠.

AI의 수능 시험 도전, 어떤 의미가 있을까?

이번 실험을 통해 AI가 수능과 같은 고난이도 시험에서 어떤 강점과 약점을 가지고 있는지 더욱 명확히 확인할 수 있었습니다.

AI는 논리적·수리적 문제 해결 능력이 뛰어나지만, 문맥을 깊이 이해해야 하는 언어 문제에서는 한계를 보인다.
딥시크는 아시아권 데이터를 더 많이 학습한 만큼, 한국 전통 문학과 같은 특정 분야에서 강점을 발휘할 가능성이 크다.
AI 모델이 특정 과목이나 유형에 최적화될수록, 다른 영역의 성능이 저하될 수도 있다.

특히, 딥시크가 오픈소스로 공개되면서 글로벌 AI 시장에서도 주목받고 있는 상황입니다. 높은 성능 대비 뛰어난 가성비를 내세우며 AI 경쟁에서 입지를 넓혀가고 있죠. 앞으로 AI 기술이 더욱 정교해진다면, 수능과 같은 복잡한 시험에서도 인간과 비슷하거나 더 나은 성과를 낼 가능성이 충분합니다.

AI가 수능 문제를 푸는 모습, 직접 확인해보세요!

👉 영상 바로 보기

AI가 인간의 지적 능력을 어디까지 따라잡을 수 있을까요? 여러분은 어떻게 생각하시나요? 댓글로 여러분의 의견을 공유해주세요!

저작자표시

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

oSSo의 세상이야기

챗GPT vs 딥시크: 2025 수능 AI 성능 비교!