네카오도 원했던 ‘공개된 정보’ AI 활용 지침 나왔다…韓 AI 시계 빨라질까

입력 2024-07-17 16:35수정 2024-07-17 17:06

  • 작게보기

  • 기본크기

  • 크게보기

국내 인공지능(AI) 선도기업인 네이버와 카카오 중 한 곳과 국내 AI 유명 스타트업이 주문한 AI의 ‘공개된 정보’ 활용 지침이 마련됐다. AI 기업의 개인정보 침해 가능성을 최소화하고, 불확실성을 해소해 AI 진흥을 돕겠다는 정부의 의지로 해석된다. 해당 기준이 마땅치 않아 데이터 학습에 애를 먹었던 국내 AI 기업들이 모호함을 해소해 AI 개발, 활용 속도를 낼 수 있을지 주목된다.

17일 양청삼 개인정보보호위원회 개인정보정책국장은 정부서울청사에서 브리핑을 열고 “빠르게 변화하고 있는 AI·데이터 처리 환경에 적용할 수 있는 개인정보 보호 원칙과 기준을 구체화했다”며 “공개된 개인정보가 적법하고 안전하게 활용될 수 있도록 일정한 기준을 제시해 기업 불확실성을 낮추고 국민 신뢰를 높이기 위해 준비했다”고 말했다.

공개된 데이터란 인터넷상에서 누구나 합법적으로 접근할 수 있는 데이터로, 생성형 AI 학습 데이터의 핵심 원료 쓰인다. AI 기업들은 커먼 크롤(인터넷상 데이터를 수집하고 누구나 접근해 분석할 수 있도록 저장·유지·관리하는 공개 저장소), 위키백과, 블로그 등에 있는 공개 데이터를 자동 추출 기법 등의 방식으로 수집해 활용하고 있다.

그러나 이같은 공개 데이터에는 주소, 신용카드 번호 등 여러 개인정보가 포함될 수 있어 개인정보 침해 우려가 크다는 문제점이 있다. 실제로 개인정보위가 커먼 크롤의 임의 데이터(31MB)를 추출해 분석한 결과 주소, 전화번호, 계좌번호, 신용카드 번호 등 520건의 개인정보가 포함된 것으로 나타났다.

▲양청삼 개인정보보호위원회 개인정보정책국장이 17일 서울 종로구 정부서울청사에서 '인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서' 브리핑을 하고 있다. (사진=뉴시스)

이에 개인정보위는 ‘AI 프라이버시 민·관 정책협의회’에서 논의된 내용을 바탕으로 이번 안내서를 마련하게 됐다. 안내서에는 △공개된 개인정보가 AI개발·서비스에 활용될 수 있음을 명확히 인정 △실질적 법적 근거로 ‘정당한 이익’ 기준 제시 △이를 위해 개인정보 보호를 위한 안전성 확보 조치 및 정보주체 권리보장 수단 마련·안내 등이 담겼다. 특히 정당한 이익이 적용되기 위해서는 다시 △AI 개발 목적의 정당성 △공개된 개인정보 처리의 필요성 △구체적 이익 형량이라는 3가지 요건이 충족돼야 한다.

또 정당한 이익을 근거로 공개된 개인정보를 처리하기 위해 고유 식별정보 등에 대한 삭제와 비식별화 등의 기술적 안전조치와 ‘(가칭) AI 프라이버시 레드팀’ 구성·운영 등의 관리적 안전조치 방안도 공개됐다. 개인정보 유·노출 발생시 삭제, 처리 정지 등 정보주체의 권리보장 방안도 확인할 수 있다.

다만 AI 기업이 모든 안전조치를 의무적으로 시행해야 하는 것은 아니다. AI 기업은 개별 조치의 장·단점, 부작용, 기술 성숙도를 고려해 자율적으로 선택해 이행할 수 있다. 가이드라인의 실효성에 대해 양 국장은 “명백한 위험들이 있는데 기술적·관리적 조치들을 아무 것도 안 한다면 적법 처리 근거로서 정당한 이익을 원용할 수 없다”며 “그러면 비적법하게 공개된 데이터, 개인정보를 처리한 것으로, 자체로 위법한 것”이라고 말했다.

국내 AI 기업들은 법적 모호성을 해소해 AI 개발, 활용에 속도를 올릴 수 있을 것으로 보인다. 실제로 네이버와 카카오 중 한 곳과 국내 유명 AI 스타트업 한 곳은 개인정보위에 이와 같은 지침이 필요하다는 목소리를 전한 바 있다. 정부 차원의 가이드라인이 제시되면 AI 언어 모델 고도화, 활용 시 법 망을 벗어나지 않는 선에서 데이터 활용을 최대화할 수 있기 때문이다.

  • 좋아요0
  • 화나요0
  • 슬퍼요0
  • 추가취재 원해요0
주요뉴스
댓글
0 / 300
e스튜디오
많이 본 뉴스
뉴스발전소