“연구 목적 누구나 활용”…LG, 오픈소스 AI ‘엑사원 3.0’ 공개

“연구 목적 누구나 활용”…LG, 오픈소스 AI ‘엑사원 3.0’ 공개

기사승인 2024-08-07 14:57:10
LG AI연구원이 인공지능(AI) 모델 ‘엑사원 3.0’을 오픈소스로 공개했다. 연구 목적이라면 누구나 활용 가능하다. 

LG AI연구원은 7일 엑사원 3.0의 모델 학습 방법, 성능 평가 결과 등을 담은 기술보고서를 발표했다. LG AI연구원은 지난 2021년 거대언어모델(LLM) ‘엑사원 1.0’ 발표 후 생성형 AI를 실제 산업 현장에 적용하기 위한 연구개발에 집중해 왔다. 

이번에 선보인 엑사원 3.0은 성능과 경제성이라는 두 마리 토끼를 모두 잡았다. 이전 모델인 엑사원 2.0 대비 추론 처리 시간은 56%, 메모리 사용량은 35%, 구동 비용은 72% 줄었다. AI로 인해 촉발된 소비 전력 문제를 해결하기 위해 경량화·최적화 기술 연구에 집중, 초기 거대 모델 대비 성능은 높이면서도 모델 크기는 100분의 3으로 줄이는 데 성공했다.

엑사원 3.0 등 오픈소스 모델 성능 비교. LG 

또한 한층 더 똑똑해졌다. 엑사원 3.0은 코딩과 수학 영역 등 13개 벤치마크(성능 평가 지표) 점수 순위에서 1위를 차지해 메타의 라마3.1, 구글의 젬마2 등 동일 크기의 글로벌 오픈소스 AI 모델과의 비교에서도 글로벌 경쟁력을 입증했다. 한국어와 영어를 학습하고 이해할 수 있는 이중언어 능력도 갖췄다. 특히 한국어 성능도 세계 최고를 기록했다. 

이번에 공개한 엑사원 3.0은 특허와 소프트웨어 코드, 수학, 화학 등 국내외 전문 분야 데이터 6000만건 이상을 학습했다. LG AI연구원은 연말까지 법률, 바이오, 의료, 교육, 외국어 등 분야를 확장해 학습 데이터양을 1억건 이상으로 늘려 엑사원 3.0의 성능을 더 끌어올릴 계획이다. LG AI연구원은 AI 모델에 의도적으로 공격을 시도해 기술과 서비스 취약점을 검증하고 이를 보완하고 개선하는 레드티밍도 수행하는 등 엑사원 3.0의 안전성과 신뢰성을 높이기 위한 작업도 진행했다.

하반기부터는 엑사원 3.0이 적용된 LG 제품 및 서비스를 개발에도 돌입한다. LG AI연구원은 LG 계열사들과 함께 제품 및 서비스를 준비한다는 방침이다. 온디바이스 AI에 들어갈 ‘초경량 모델’부터 범용 목적의 ‘경량 모델’, 특화 분야에 활용할 수 있는 ‘고성능 모델’까지 활용 용도에 따라 모델 크기를 다르게 설계됐다. LG 계열사들은 각 사가 보유한 데이터로 엑사원 3.0을 최적화하고, 사업과 제품, 서비스 특성에 맞게 이를 적용해 혁신 속도를 높여갈 계획이다.

LG AI연구원은 글로벌 파트너십 논의도 활발하게 진행 중이다. 배경훈 LG AI연구원장은 “실제 산업 현장에서 활용할 수 있는 AI를 만드는 것이 중요한 만큼 특화된 성능과 경제성을 갖춘 엑사원으로 LG 계열사와 외부 기업 및 기관과의 파트너십을 강화해 나갈 계획”이라며 “특히 국내에서는 처음으로 자체 개발한 AI 모델을 오픈소스로 공개해 학계, 연구 기관, 스타트업 등이 최신 생성형 AI 기술을 활용할 수 있게 함으로써 개방형 AI 연구 생태계 활성화와 더 나아가 국가 AI 경쟁력을 높이는 데 기여하고자 한다”고 강조했다.

챗엑사원 이미지. LG

LG 임직원을 대상으로 한 ‘챗엑사원’ 베타 서비스도 시작한다. 챗엑사원은 엑사원 3.0을 기반으로 생성형 AI 서비스로 △실시간 웹 정보 기반 질의응답 △문서, 이미지 기반 질의응답 △코딩 △데이터베이스 관리 등 업무 편의성과 효율성을 높일 수 있는 다양한 기능을 제공한다. LG 임직원은 검색부터 요약, 번역, 데이터 분석, 보고서 작성, 코딩까지 AI를 다양한 업무에 활용하며 일하는 방식의 변화를 경험할 수 있다.

LG AI연구원 관계자는 “생성형 AI는 입력하는 지시문 즉, 질문을 어떻게 하는지에 따라 다른 결과물을 생성한다”며 “관심 직무와 업무 특성에 맞는 질문, AI가 답변한 결과에 이어서 입력할 수 있는 질문 등을 추천해 주는 기능도 개발해 적용함으로써 생성형 AI 이용에 익숙하지 않은 임직원들도 편하게 활용할 수 있게 했다”고 말했다.

챗엑사원은 소프트웨어 개발자와 데이터 분석 전문가를 위한 기능도 제공한다. LG AI연구원은 챗엑사원이 자연어(사람이 일상적으로 사용하는 언어) 입력만으로 파이썬, 자바, C++ 등 22개 프로그래밍 언어와 데이터베이스 관리에 활용할 수 있는 SQL(구조화된 질의 언어, Structured Query Language) 쿼리까지 생성할 수 있어 임직원의 업무 효율성을 높일 수 있을 것으로 기대하고 있다.

LG AI연구원은 연말까지 베타 서비스를 진행하며 임직원들의 의견과 아이디어를 반영한 업데이트를 주기적으로 시행하고, 정식 서비스와 모바일 앱은 LG 계열사별 준비 상황에 맞춰 순차적으로 제공할 예정이다.

사내 문서 학습 및 보안 데이터 관리가 필요한 계열사의 경우 지난 6월 LG디스플레이가 사내 문서 30만여 건을 추가 학습해 제품 품질 등 공정 관련 질의응답이 가능한 생성형 AI를 구축한 사례와 같이 별도의 특화 서비스 구축을 진행할 계획이다.

 
이소연 기자
soyeon@kukinews.com
이소연 기자
이 기사 어떻게 생각하세요
  • 추천해요
    0
  • 슬퍼요
    0
  • 화나요
    0
추천기사
많이 본 기사
오피니언
실시간