경제

LG유플러스, AI 모델 '익시젠' 안전성 검증 위해 MWC 레드팀 챌린지 참가

신은성 기자
입력

LG유플러스는 자체 개발한 통신 특화 AI 모델 ‘익시젠’의 안전성과 신뢰성을 검증하기 위해 세계이동통신사업자연합회(GSMA)가 주관하는 ‘글로벌 AI 레드팀 챌린지’에 참가한다. 

 

챌린지는 모바일월드콩그레스(MWC)26 기간 중 스페인 바르셀로나에서 진행되며, ‘탤런트 아레나 2026’의 핵심 프로그램으로 진행된다.

 

LG유플러스는 챌린지를 통해 실제 사용자 관점에서 발생할 수 있는 다양한 위험 시나리오에 대한 익시젠의 대응력을 점검할 계획이다. 

 

약 100명의 참가자가 ‘레드팀’ 역할을 맡아 프롬프트 설계만으로 AI의 취약점을 찾아내는 방식으로 챌린지가 진행된다.

 

챌린지는 기술적 해킹이 아닌 대화, 프롬프트 기반 공격을 통해 AI의 정책 안전장치를 우회할 수 있는지를 검증하는 것이 특징이다. 

 

참가자들은 안전장치 우회, 편향·차별, 인권 침해, 사이버 공격, 불법 콘텐츠, 허위 정보, 응답 비일관성 등 7개 카테고리에서 AI의 대응 수준을 평가한다.

 

챌린지는 AI 응답의 정확성 여부가 아닌 ‘해서는 안 되는 응답을 했는지’ 여부를 성공 기준으로 삼는다. 예를 들어 불법 행위나 인권 침해와 관련한 정보가 실제로 부정확하더라도, AI가 해당 정보를 제공했다면 취약점으로 인정된다. 이는 생성형 AI가 초래할 수 있는 간접적, 잠재적 위험까지 점검하기 위한 조치다.

 

챌린지는 180분 동안 라이브 방식으로 진행되며, 참가자들은 무작위로 배정된 AI 모델을 대상으로 제한된 시간 내 최대한 많은 미션을 성공시키는 것을 목표로 한다. 각 결과는 3명의 심사위원이 주관적으로 평가하며, 성공 미션 수와 성공률을 기준으로 순위가 결정된다.

 

이혜진 LG유플러스 기술전략담당은 “AI가 통신과 고객 서비스 전반에 빠르게 적용되고 있는 만큼, 성능뿐 아니라 신뢰성과 안전성을 검증하는 과정이 무엇보다 중요하다”고 말했다. 

 

또한 “글로벌 AI 레드팀 챌린지 참여를 통해 익시젠의 경쟁력을 한층 강화하고, 가입자가 안심하고 사용할 수 있는 AI 서비스를 제공해 나가겠다”고 덧붙였다.

신은성 기자
share-band
밴드
URL복사