국내 초거대 AI 속속 등장하는데…학습 기준은 ‘깜깜’

국내 초거대 AI 속속 등장하는데…학습 기준은 ‘깜깜’

기사승인 2023-08-25 06:05:02
최수연 네이버 대표가 24일 ‘하이퍼클로바X’를 기반으로 한 새로운 서비스를 소개했다. 네이버 

국내 초거대 인공지능(AI)이 속속 등장하고 있다. 다만 이를 뒷받침할 가이드라인은 여전히 걸음마 단계인 상황이다.

24일 네이버는 거대언어모델(LLM) ‘하이퍼클로바X’를 기반으로 한 새로운 서비스를 공개했다. 대화형 AI 서비스 ‘클로바X’, 생성형 AI 검색 서비스 ‘큐(CUE):’ 등이다.

네이버는 이날 하이퍼클로바X에 대해 ‘광범위한 양질의 데이터를 바탕으로 한국 문화와 언어를 가장 잘 이해하고 있는 언어모델’이라고 설명했다. 최수연 네이버 대표도 “네이버는 사용자 여정을 모두 아우르는 서비스를 제공한다. 광범위한 양질의 데이터 축적이 가능하다는 것”이라며 “매일 광범위하게 생성, 갱신되는 데이터를 학습한 LLM은 생성형 AI 시대에 누구도 따라올 수 없는 경쟁력을 가진다”고 강조했다.

새롭게 도입될 검색 서비스 큐:의 경우, 기존 LLM과 달리 학습 데이터에 의존하지 않고 검색 결과에 기반한 답변을 생성한다. 네이버 지식백과와 뉴스 등 출처가 명확한 콘텐츠 내에서 최신 정보를 분석, 답변한다는 것이다.

김용범 네이버 서치 US AI 기술 총괄이 새로운 검색 서비스 큐:에 대해 발표하고 있다. 네이버 

네이버는 LLM 학습 데이터와 뉴스 데이터 출처 등에 대해서는 말을 아꼈다. 네이버는 블로그와 카페, 지식인, 뉴스 등 네이버에서 검색되는 문서를 토대로 학습하는 것으로 알려졌다. 네이버는 지난 2018년 이용 약관을 개정하면서 ‘이용자가 제공한 콘텐츠는 서비스 개선 및 새로운 서비스 제공을 위해 AI 기술 등의 연구개발 목적으로 네이버 및 네이버 계열사에 사용될 수 있다’는 문구를 넣었다.

이날 기자간담회에서 구체적인 학습데이터 출처와 지불 방침 등을 묻자 최 대표는 “규제나 약관 등에 근거를 둔 학습데이터를 사용했다. 별도 사용료에 대해 논의를 하고 있지는 않다”고 답했다. 학습데이터 및 답변에 사용되는 뉴스 콘텐츠 방침에 대해서도 “명확하게 답변을 드리기 어렵다”면서 “앞으로 학습에 활용하는 부분에 대해서는 거부하시는 부분에 대해 활용하지 않는 방향으로 계획을 잡고 있다. 저희도 아직 답을 알 수 없다. 추후 규제나 논의를 따라갈 것”이라고 했다.

클로바X 시연 모습.    영상=이소연 기자 

초거대 AI 학습 데이터에 대한 논란은 국내외에서 현재 진행 중이다. 저작권이 있는 저작물을 AI 학습에 무단으로 사용한다는 비판도 끊이지 않는 상황이다. 미국 언론사 뉴욕타임스는 챗GPT 개발사인 오픈 AI의 웹 크롤링을 차단했다. 지난 3일에는 약관을 개정, 뉴욕타임스의 기사와 사진 등을 AI 학습에 사용할 수 없도록 했다. 한국신문협회도 지난 22일 네이버와 카카오, 구글코리아, 마이크로소프트 등 IT 기업에 생성형 AI 학습 데이터 출처를 공개하고 뉴스 저작물에 대한 적정한 대가 산정 기준을 마련할 것 등을 요구했다.

IT 업계에서는 막연한 규제보다는 AI 학습에 사용할 수 있는 데이터 기준을 확립, 발전 기회를 마련해줘야 한다는 목소리가 나온다. 업계 관계자는 “영어에 비해 한국어 학습데이터는 현저히 부족한 상황”이라며 “어떤 데이터를 사용할 수 있는지, 구매해 써야 하는 기준은 무엇인지 등 명확한 기준을 AI가 발전할 수 있는 방향으로 논의해야 한다”고 이야기했다.

과학기술정보통신부.    사진=박효상 기자 

초거대 AI 관련 법제 정비는 이제 막 발을 뗀 상황이다. 과학기술정보통신부는 지난 16일 ‘제4기 인공지능 법제 정비단’을 출범시켰다. 초거대 인공지능 관련 규제 개선 및 인공지능 신뢰 기반 조성을 위한 제도 정립 등을 논의한다. 오는 연말에 관련 청사진을 발표할 것으로 보인다. 초거대 AI 개발 및 활용 촉진을 위한 저작권, 정보보호 법령 규제 개선 방향을 현재 검토 중이다. 규정이 정해지면 기존 AI 개발에 쓰인 학습데이터에도 소급 적용을 검토하는 내용에 대해서도 논의가 오간 것으로 전해졌다. 다만 일반론적으로는 소급 적용을 하지 않기에 이 경우에는 특례를 적용해야 한다.

과기정통부 관계자는 “아직 업계·학계 등에서 논의되는 현황을 살펴보는 단계”라면서 “학습데이터 기준과 관련해 전세계적으로 논의가 뜨겁게 진행되고 있기에 아직은 지켜봐야 하는 상황”이라고 밝혔다.

이소연 기자 soyeon@kukinews.com
이소연 기자
soyeon@kukinews.com
이소연 기자
이 기사 어떻게 생각하세요
  • 추천해요
    0
  • 슬퍼요
    0
  • 화나요
    0
추천기사
많이 본 기사
오피니언
실시간