창조하신 대로 사는 생활 지식/창조주 하나님의 사회: 이런 일이?

챗GPT는 시작에 불과⋯알면 도움되는 인공지능툴 TOP 4

heojohn 2023. 3. 5. 10:33

이시내입력 2023. 3. 5. 07:08

구글 딥마인드가 개발한 바둑 프로그램 ‘알파고’는 2016년 3월 당시 이세돌 9단을 연거푸 꺾으며 화제의 중심에 올랐었죠. 유튜브를 통해 생중계된 첫 대국에만 전 세계 8000만명 이상의 시청자가 몰렸던 바 있습니다. 그 바톤(배턴)을 챗GPT가 이어받은 듯합니다. 

챗GPT는 미국 인공지능 연구기업 ‘오픈AI’가 지난해 11월 공개한 인공지능 챗봇입니다. 실제 사람과 대화하는 듯한 착각을 줄 정도의 엄청난 성능 때문에 일대 파란이 일고 있습니다. 공개 5일 만에 사용자 수 100만명을 돌파하더니, 2개월 만에 월간활성이용자수(MAU)가 1억명을 기록했습니다.  

알파고 때와 다른 점은 ‘접근성’입니다. 인공지능 전문가가 아니더라도, 인터넷에만 접속할 수 있다면 누구나 챗GPT를 쓸 수 있습니다. 사회관계망서비스(SNS)에선 챗GPT 사용후기를 심심찮게 볼 수 있습니다. 전문가들의 전유물인 줄로만 알았던 인공지능이 대중과 부쩍 가까워진 겁니다.  

해외에선 챗GPT 외에도 다양한 생성형 인공지능(Generative AI) 모델이 널리 사용되고 있습니다. 생성형 인공지능은 텍스트·이미지·오디오 같은 새로운 콘텐츠를 생성하는 데 중점을 둔 모델입니다. 기존 데이터를 학습하며 익힌 패턴을 바탕으로 원본과는 다른 결과물을 만들어내는 겁니다. “모방은 창조의 어머니”라는 말을 그대로 실현한 셈이죠. 

해외에서 입소문이 난 인공지능 툴을 모았습니다. 별도의 프로그램을 설치하지 않아도 웹에서 쉽게 이용할 수 있는 서비스들로만 추려봤습니다.  

1. 이미지가 필요할 땐? 달리2(DALL·E2)

“퇴근하고 지하철을 탄 한국여성을 그려줘”. 텍스트창에 내용을 입력하자 눈 깜짝할 새 다음과 같은 이미지가 화면에 뜹니다.

텍스트를 이미지로 변환하는 인공지능 ‘달리2(DALL·E2)’. “퇴근하고 지하철을 탄 한국여성(A very irritated Korean woman boarding the subway after work)"을 그려달라고 하자 수초내로 뜬 사진입니다.

텍스트를 토대로 이미지를 그려주는 인공지능 ‘달리(DALL·E)’입니다. 달리는 애니메이션 영화 '월-E(WALL-E)'와 스페인의 초현실주의 화가 살바도르 달리에서 따온 이름입니다. 챗GPT를 만든 오픈AI에서 2021년 1월 공개한 서비스입니다. 사진부터 유화, 만화에 이르기까지 다양한 유형의 이미지를 만들 수 있습니다.    특정 화가의 화풍을 콕 집어 주문할 수도 있습니다. “한국 농민을 고흐 풍으로 그려달라”고 요청했더니 몇초 지나지 않아 네덜란드 화가 빈센트 반 고흐 화풍의 작품이 완성됩니다. 

텍스트를 이미지로 변환하는 인공지능 ‘달리2(DALL·E2)’. 한국 농민을 고흐풍으로 그려달라”고 요청했더니 몇초 지나지 않아 네덜란드 화가 빈센트 반 고흐 화풍의 그림이 완성됩니다.

  엉뚱한 지시를 내려도 초현실적인 이미지로 소화합니다. "시바견과 부유한 남성이 화성에 있는 모습"을 그려달라고 했더니, 다음과 같은 그림을 띄워줍니다. 시바견, 부유한 남성, 그리고 화성. 전혀 어울리지 않는 단어를 가지고도 어떻게든 엮어 결과물을 만들어내는 겁니다.  

‘달리2(DALL·E2)’는 초현실적인 이미지도 그려냅니다. 예컨대 시바견과 부유한 남성이 화성에 있는 모습"을 그려달라고 지시하면 다음과 같은 그림을 띄워줍니다. 시바견, 부유한 남성, 그리고 화성. 전혀 어울리지 않는 단어를 가지고도 결과물을 만들어내는 겁니다.

  오픈AI는 현재 달리2 베타 버전을 공개하고 있습니다. 한달간 무료로 작품 50건을 만들 수 있습니다. 이렇게 만든 이미지는 저작권 걱정 없이 상업적 용도로 활용할 수 있습니다. 

2. 번역이 필요할 땐? 딥엘(DeepL)

독일 AI기업 딥엘(DeepL)이 내놓은 번역기입니다. 2017년 처음 공개된 이 번역기는 딥러닝을 활용한 인공지능 모델이긴 하지만, 엄밀히 말해 ‘생성형’ 인공지능은 아닙니다. 챗GPT와 달리 새로운 콘텐츠를 만들어내지는 않기 때문입니다. 하지만 블라인드 테스트에서 구글 번역기를 제칠 정도의 성능을 자랑해 해외에선 화제가 되고 있습니다. 국내에서도 한국어 서비스가 1월말부터 시작되면서 조금씩 입소문이 나고 있습니다. 

딥엘 번역기는 얼마나 정확할까요? 블라디미르 나보코프의 소설 ‘롤리타’의 유명한 문장을 중심으로 구글, 네이버의 파파고 등 다른 번역기와 비교해봤습니다.

원문 :  Lolita, light of my life, fire of my loins. My sin, my soul. Lo-lee-ta: the tip of the tongue taking a trip of three steps down the palate to tap, at three, on the teeth. Lo. Lee. Ta. She was Lo, plain Lo, in the morning, standing four feet ten in one sock. She was Lola in slacks. She was Dolly at school. She was Dolores on the dotted line. But in my arms she was always Lolita.

딥엘 : 롤리타, 내 삶의 빛, 내 허리의 불. 나의 죄, 나의 영혼. 로-리-타:  혀끝을 입천장을 따라 세 걸음 내려가 세 번째에 치아를 두드리는 동작. Lo. 리. Ta. 그녀는 아침에 양말 한 켤레를 신고 4 피트 10에 서있는 로, 평범한 로였습니다. 그녀는 바지를 입은 롤라였습니다. 그녀는 학교에서 돌리였습니다. 그녀는 점선 위의 돌로레스였습니다. 하지만 내 품 안에서는 언제나 롤리타였어요.

구글 : 롤리타, 내 삶의 빛, 내 허리의 불. 내 죄, 내 영혼. Lo-lee-ta:  혀 끝이 입천장 아래로 세 단계 이동하여 세 단계에서 치아를 두드립니다. 봐라. 이씨. 고마워.  그녀는 아침에 양말 한 짝을 신고 4피트 10인치로 서 있는 Lo, 평범한 Lo였습니다. 그녀는 바지를 입은 롤라였습니다. 그녀는 학교에서 돌리였습니다. 그녀는 점선의 Dolores였습니다. 하지만 내 품에 안긴 그녀는 언제나 롤리타였다. 

파파고 : 로리타, 내 삶의 빛, 내 허리의 불. 내 죄, 내 영혼. Lo-lee-ta:  혀끝은 세 번에 이빨을 두드리기 위해 입천장 아래로 세 걸음 이동합니다. Lo. Lee. 타. 그녀는 로, 평범한 로, 아침에 양말 한 짝에 4피트 10인치에 서 있었다. 그녀는 슬랙스를 입은 롤라였다. 그녀는 학교에서 돌리였다. 그녀는 점선에 있는 돌로레스였다. 하지만 내 품에서 그녀는 항상 로리타였다.

존댓말과 반말을 섞어 쓴 구글, 파파고와는 달리, 딥엘이 옮긴 문장은 꽤나 안정적입니다. 

“혀 끝이 입천장을 따라 세 걸음 걷다 세 걸음째에 앞니를 가볍게 건드린다(문학동네 번역)". 번역기에 맡기기에 상당한 난도가 있어 보이는 문장을 딥엘은 “혀끝을 입천장에 따라 세 걸음 내려가 세 번째 치아를 두드리는 동작”라고 비교적 매끄럽게 옮겼습니다. 

“혀 끝이 입천장 아래로 세 단계 이동하여(구글)”, “혀끝은 세 번에 이빨을 두드리기 위해 입천장 아래로 세 걸음 이동합니다(파파고)”라는 어색한 문장과는 대조적입니다. 구글은  “Lo. Lee. Ta”를 “봐라. 이씨. 고마워”라고 옮겼네요. 

3 . 음악이 필요할 땐? 사운드드로우(Soundraw)

나만의 음원을 만들 수 있는 서비스 사운드드로우(Soundraw)

사운드드로우(Soundraw)는 인공지능의 도움을 받아 나만의 음원을 만들 수 있는 서비스입니다. 악보를 읽지 못해도 괜찮습니다. 선호하는 장르·분위기·템포·악기 등을 선택해서 버튼만 누르면 10초도 지나지 않아 15곡이 뚝딱 나옵니다. 

여기에 음악의 속도나 강약 등을 조절할 수 있는 편집기능도 있습니다. 원하는 곡이 나올 때까지 음원을 계속해서 다시 만들 수 있는 겁니다.

나만의 음원을 만들 수 있는 서비스 사운드드로우(Soundraw). 공식 웹사이트에 접속해 로그인을 하지 않은 상태에서 화면 중앙에 있는 ‘Create music’을 누르면 무료 체험이 가능합니다.

공식 웹사이트에 접속해 로그인을 하지 않은 상태에서 화면 중앙에 있는 ‘Create music’을 누르면 무료 체험이 가능합니다. 하지만 음악을 다운받거나, 사용하려면 유료 계정(한달 17달러·한화 2만원 가량)으로 가입해야 합니다.  

사운드드로우는 2020년 2월에 설립됐으며 일본 도쿄에 본사를 두고 있습니다. 

4. 영상이 필요할 땐? 루멘5(Lumen5) 

루멘5(Lumen5)는 텍스트로 영상을 만듭니다. 루멘5 스토리보드 화면.

  ‘달리’가 텍스트를 바탕으로 이미지를 생성한다면, 루멘5(Lumen5)는 텍스트로 영상을 만듭니다. 머신러닝 알고리즘을 사용해 텍스트를 분석한 뒤 내용에 걸맞는 영상과 이미지를 배치합니다. 맥락상 중요하다고 판단되는 텍스트는 폰트 크기 등을 키워 강조하기도 합니다.    루멘5 웹사이트에 접속해 무료 계정으로 로그인한 뒤, 영문 텍스트를 입력하면 곧바로 동영상 흐름을 요약한 스토리보드가 나옵니다. 이용자는 이 화면에서 필요한 부분을 편집해 동영상으로 만들 수 있습니다.    루멘5는 유튜브 인트로, 홍보 영상 등 다양한 용도로 활용되고 있습니다. 무료로도 사용할 수 있지만 영상에 회사 워터마크가 들어갑니다. 아직 한국어 서비스는 지원하고 있지 않아 영문 텍스트로만 영상 작업을 해야 합니다. 2016년에 설립된 루멘은 캐나다 밴쿠버에 본사를 두고 있습니다.   이시내 기자 cine@nongmin.com