창조하신 대로 사는 생활 지식/창조주 하나님의 사회: 이런 일이?

'AI 창작'에 진심인 구글...비디오·글·음악 생성기 동시 공개

heojohn 2022. 11. 7. 00:45
  • 기자명 임대준 기자
  • 입력 2022.11.03 17:25
  • 수정 2022.11.03 17:29
언어지원·재난관리 등 AI 3대 프로젝트 발표
 

구글이 인공지능(AI) 창작 기술에 힘을 실었다.

구글은 2일(현지시간) 뉴욕 피어57 캠퍼스에서 'AI@ 2022' 이벤트를 열고 'AI가 세계적으로 유용한 기술을 확장하는 3가지 방법'이라는 주제로 ▲언어 지원 ▲창작 지원 ▲재난관리 및 의료 등의 AI 기술 개발 및 적용 사례를 발표했다.

가장 관심을 끈 것은 AI 생성기를 이용한 창작 분야다. 구글은 이날 비디오와 글, 음악 등 최근 큰 이슈를 모으는 AI 창작 기술 전 분야에 대한 모델을 소개했다.

이 가운데 '이매진'과 '페나키'는 이미 지난달초 일부 매체가 공개한 AI 비디오 생성기다. 이매진은 고화질 영상을 만드는데 특화됐으며, 페나키는 상세하게 묘사한 명령어를 이해해 장편의 영상을 만들어 주는 것이 특징이다. 이들은 현재 공개된 AI 동영상 생성기 가운데 가장 뛰어난 퀄리티를 자랑한다.

구글은 크리에이터와 아티스트의 역량 강화를 위해 이 기술을 개발했다며, 모바일용 앱 'AI 테스트키친'에 곧 도입할 것이라고 밝혔다.

또 짧은 문장을 입력하면 AI로 이야기를 이어가는 '워드크래프트'와 짧은 오디오 샘플을 기반으로 음성과 음악을 생성해내는 '오디오LM'도 선보였다. 둘 다 결과물이 인간이 창작한 듯 자연스럽다는 점을 강조했다.

AI 생성 기술은 흥밋거리를 넘어 사업적으로도 기대를 모으는 분야다. 무서운 기세로 사용자를 늘여가는가 하면, 개발 업체에는 천문학적인 투자가 몰려 들고 있다. 현재는 비즈니스 모델이 유료 서비스에 국한돼 있지만, 확장 가능성을 보고 수많은 업체들이 참가해 경쟁을 펼치는 분야다.

구글은 AI 생성 기술에 대한 원칙도 강조했다. 더글러스 에크 구글리서치 선임 연구국장은 "우리는 창조적 표현의 방식이 완전히 달라지는 전환점에 와 있다"면서도 "그러나 이러한 기술이 진짜와 진짜가 아닌 것의 경계를 흐리는 것을 원하지 않는다"고 말했다.

동영상 생성 AI 모델 '페나키' (사진=구글)

이어 전 세계 7000개 언어 가운데 사용 인구가 많은 1000개 언어를 지원하는 '1000개 언어 이니셔티브'라는 AI 모델 연구 프로젝트를 시작했다고 발표했다.

가장 많은 400개 언어에 대해서는 머신러닝으로 '유니버설 스피치 모델'을 개발했고, 희귀 언어를 대상으로는 직접 수집한 영상과 이미지, 음성 등 다양한 정보에 기반해 언어를 학습하는 업그레이드 모델을 개발했다고 설명했다.

얀 스칼퀵 구글 선임연구원은 이 프로젝트를 통해 "유튜브, G보드, 구글 번역 등을 발전시켜 전 세계 수십억명이 자신의 모국어로 이러한 서비스를 쉽게 사용할 수 있게 도울 것"이라고 말했다.

구글은 이 날 AI를 이용한 재난관리 시스템도 선보였다.

현재 인도와 방글라데시에서 시행 중인 AI 기반 홍수 경보 서비스를 전 세계 20개국으로 확대, 브라질과 콜롬비아, 스리랑카와 아프리카 15개국을 추가했다고 밝혔다. 홍수 가능성이 있는 장소와 시간대를 알려주는 플랫폼 '구글 플러드허브'도 오픈했다.

머신러닝을 활용해 홍수의 진행 흐름을 예측하는 이 서비스는 지난 2017년 시작, 지난해 인도와 방글라데시에서 2300만명의 이용자에게 1억1500만건의 홍수 경보를 전달했다. 구글은 신뢰할 만한 홍수 조기 경보시스템이 사망자의 43%, 경제적 피해의 35∼50%를 예방할 수 있다고 밝혔다.

산불 경보 시스템도 도입, 위성사진을 이용한 머신러닝 모델로 실시간으로 산불 위치를 확인하고 추적해 어떻게 퍼져나갈지를 예측하는 서비스도 공개했다. 이 시스템은 호주, 미국, 캐나다, 멕시코에서 운용 중이다.

더불어 저소득 국가의 산모 생존율을 높이고 망막 질병을 모니터링하는 등 보건의료 개선에도 AI 기술을 도입했다고 구글은 밝혔다.

AI를 탑재한 로봇 팔 시연 장면 (사진=구글)

이 밖에도 AI와 로봇팔을 접목한 기술을 선보였다. 사용자가 '가장 좋아하는 컵은 파란색이고 가장 좋아하는 사탕은 M&M'이라고 밝히면, 언어모델로 학습한 로봇팔이 이를 알아듣고 자체 코드를 생성해 파란색 컵에 M&M를 넣는 식이다.

임대준 기자 ydj@aitimes.com