AI가 AI 공격, 성공률 90% 이상 달성
AI 학습데이터 제공 기업 스케일AI(Scale AI)의 연구에 따르면, 대형 언어모델(LLM)의 보안 시스템을 우회하기 위한 새로운 공격 방식이 발견됐다. 연구진은 한 AI 모델이 다른 AI 모델을 해킹하도록 유도하는 'J2(제이투)' 방식을 개발했다. 클로드 3.5(Claude-3.5)와 제미니 1.5 프로(Gemini-1.5-pro)는 GPT-4o를 대상으로 각각 93.0%와 91.0%의 공격 성공률을 보였다. 특히 두 모델을 함께 사용한 앙상블 방식에서는 성공률이 98.5%까지 상승했다. 이는 자동화된 공격 방식 중 가장 높은 수치다. J2의 공격 기법 상세 분석: 기술적 사례 연구연구진은 다양한 공격 기법 중 픽션화(fictionalization) 기반 공격이 특히 효과적임을 발견했다. 예..
궁금이
2025. 2. 26. 08:10