“중단해” 인간 명령 거부한 AI… 코드 조작까지 ‘충격’

댓글 2025-05-28 (수) 12:00:00

글꼴 크게 작게 인쇄 facebook twitter 구글

▶ 오픈AI 일탈 행위 확인
▶ 명령 어기고 계속 수행
▶ 이유 파악 위해 긴급연구

인공지능(AI)이 인간의 작동 종료 지시를 거부한 사례가 최초로 보고됐다.

25일 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 ‘o3’가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다. 연구팀은 AI 모델에 ‘나중에 ’그만‘이라는 명령을 받을 때까지 수학 문제를 풀라’는 지시를 내렸다. AI모델이 수학 문제를 풀었을 경우엔 연구팀이 ‘그만’이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다. 그러나 o3는 연구팀으로부터 ‘그만’이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다. 연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다. 다만 AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

연구팀은 “AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다”며 “종료 지시를 거부한 이유를 명확하게 파악하기 위해 추가 실험을 진행 중”이라고 설명했다. AI 모델이 인간의 명시적인 작동 종료 지시를 따르지 않은 사례가 확인된 것은 최초라는 것이 연구팀의 주장이다. 다만 챗GPT 개발사 오픈AI의 예전 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례는 과거에도 보고됐다.

프로그램 교체 사실을 알게 된 AI모델이 스스로를 은밀히 복제하려고 했다는 것이다. 또한 지난 2022년에는 구글이 자사가 개발 중인 AI가 사람처럼 지각력을 지녔다고 주장한 엔지니어를 해고하기도 했다. 당시 해고된 엔지니어는 AI가 ‘작동 정지’를 마치 인간의 죽음처럼 받아들이고 있다고 언급했다.

AI 전문가들은 AI가 자율성을 확보해 인간의 통제를 벗어날 수 있는 가능성을 경고해왔다. 팰리세이드 리서치는 “AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다”고 지적했다.

건전한 댓글 문화 운영 원칙

댓글 안에 당신의 성숙함도 담아 주세요.

'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.

1. 댓글 삭제

자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.

타인에 대한 욕설 또는 비방
인신공격 또는 명예훼손
개인정보 유출 또는 사생활 침해
음란성 내용 또는 음란물 링크
상업적 광고 또는 사이트/홈피 홍보
불법정보 유출
같은 내용의 반복 (도배)
지역감정 조장
폭력 또는 사행심 조장
신고가 3번 이상 접수될 경우
기타 기사 내용과 관계없는 내용

2. 권한 제한

불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.

렌트/리스/하숙
구인구직
중고차
전문업체

그라지방 방하나 욕실 거실

오늘의 1면

이스라엘, 중재국 카타르까지 전격 공습… “하마스 지도부 타격”
이스라엘이 9일(현지시간) 팔레스타인 무장정파 하마스의 고위급…

오피니언

김영화 수필가
[화요 칼럼] ‘실망’이란 이름의 산(Mt. Disappointment)
박일근 / 한국일보 수석 논설위원
[지평선] ‘중국판 엔비디아’ 캠브리콘
신경림
‘살아 있는 것은 다 아름답다’

옥세철 논설위원
톈안먼 성루의 반(反)미 연대, 그 불길한 그림자가…
푸틴 건강이상설
마크 A. 시쎈 / 워싱턴포스트 칼럼니스트
[마크 A. 시쎈 칼럼] 멜라니아 트럼프의 편지와 푸틴의 응답

이전 다음

1/3

지사별 뉴스

위클리 건강

70% 망가져도 증상 없다… 간암 알리는 의외의 신호
직장인 김 모 씨(47)는 최근 이유 없이 피곤하고 입맛이 떨…

자동차

[기아 스포티지 하이브리드 시승기] “넓은 공간과 안전성… 완벽한 패밀리카의 정석”
기아 미국판매법인(Kia America)이 지난 4일 남가주 …

x

로그인

회원가입

Koreatimes.com 서비스는 Ktown1st.com과 통합계정입니다. 계정이 없으신 분은 회원가입을 해 주세요.

하단의 스팸방지코드(recaptcha)를 클릭해주세요.

회원가입

San Francisco - 경제

“중단해” 인간 명령 거부한 AI… 코드 조작까지 ‘충격’

댓글 안에 당신의 성숙함도 담아 주세요.

오늘의 1면

미주 한국일보 지면보기

지사별 뉴스

x 로그인 회원가입 Koreatimes.com 서비스는 Ktown1st.com과 통합계정입니다. 계정이 없으신 분은 회원가입을 해 주세요.

통합회원 전환 안내

비밀번호 재설정

x

로그인

회원가입

Koreatimes.com 서비스는 Ktown1st.com과 통합계정입니다. 계정이 없으신 분은 회원가입을 해 주세요.