챗GPT가 나오면서‘생성형(Generative) AI’기술에 대한 관심이 뜨겁다. 인공지능의 전체적인 구조는 인공지능의 하위 개념이 머신러닝이고 머신러닝의 하위 개념이 딥러닝이다. 생성형 AI는 더욱더 진화된 딥러닝 기술의 일종이다. 세계경제포럼은 생성형 AI를"훈련된 데이터를 기반으로 새로운 콘텐츠를 생성하는 인공지능 알고리즘 범주"로 정의하고 있다. 생성형 AI 도구는 사용자가 무언가를 요청하면 기존에 학습한 신경망 모델을 사용해 완전히 새로운 콘텐츠를 생성한다. 예를 들어 사용자가‘아름다운 인생에 관한 시를 써달라’고 하면, 생성형 AI 도구는 이전에 학습한 시를 바탕으로 새로운 아름다운 인생에 관한 시를 지어준다.
생성형 AI 기술은 초기에는 전문 지식을 컴퓨터에 저장하고 사용자가 이 지식을 사용해 문제를 해결하는 규칙 기반 시스템 개발에 중점을 두다가, 점차 데이터 패턴을 수학적으로 모델링하는 기술로 발전했다. 이후 생성형 AI 기술의 발전에 가장 큰 계기가 된 트랜스포머(Transformer) 인공신경망이 등장한다. 트랜스포머는 문장의 단어와 같은 순차적 데이터의 관계를 추적하여 맥락과 의미를 학습하는 신경망이다. 트랜스포머는 기존의 입력과 출력을 시퀀스 단위로 처리하는 순환신경망(RNN)과 데이터의 특징을 추출해 특징의 패턴을 식별하는 구조인 합성곱신경망(CNN)보다 성능이 우수하다. 최근 컴퓨터 성능과 데이터의 증가로 인해 생성형 AI 기술의 성능이 크게 향상돼사용자가 직접 활용할 수 있는 수준까지 발전했다.
생성형 AI 기술은 텍스트, 이미지, 오디오, 비디오 등 다양한 형식의 데이터를 생성하는 기술이다. 텍스트 생성형 AI는 뉴스 기사, 소설, 시, 프로그래밍 코드, 스크립트, 악보, 이메일, 편지 등을 작성할 때 적합한 기술이다. 이미지 생성형 AI는 새로운 이미지를 생성할 때 사용되는 기술이고, 오디오 생성형 AI는 음악, 목소리, 소리 등 다양한 오디오를 만들 때 사용될 수 있다. 비디오 생성형 AI는 영화, TV 프로그램, 뮤직 비디오, 광고 등 비디오를 생성할 때 사용할 수 있는 기술이다.
생성형 AI 기술의 대표적인 도구로는 챗GPT, 바드, 달리, 이매젠 등이 있다. 챗GPT와 바드는 사용자의 질의에 적합한 답변을 텍스트나 이미지로 제공해준다. 달리와 이매젠은 원하는 이미지를 글로 기술하면 비슷한 이미지를 만들어 준다. 예를 들어 ‘고양이가 피아노를 연주하는 이미지’라고 입력하면 고양이가 피아노를 연주하는 그럴듯한 이미지가 나타난다.
생성형 AI 기술은 아직 걸음마 단계지만, 이미 우리 일상 깊숙이 스며들고 있다. 창의력이 요구되는 미술, 음악, 문학 작품 활동에는 더할 나위 없이 좋은 도구인 것 같다. 또 생각해보면 통계 데이터 분석이나 SWOT 분석을 통해 대응 전략을 도출할 때도 유용한 것 같다. 그리고 정보시스템 구축의 생산성을 높이는데도 탁월한 효과가 있을 것 같다. 사람이 사용하는 언어에 대해 프로그래밍 코드를 짜주는 기술이 탁월하다. 정보시스템 구축에서 가장 공수가 많이 들고 귀찮은 작업인 데이터 조회 화면을 만들 필요가 없다는 생각이 조심스럽게 든다. 챗GPT, 바드와 같은 화면에서 질의만 던지면 원하는 데이터를 바로 볼 수 있을 것 같아서다. 이러한 생성형 AI 기술은 지식 노동자에 큰 영향을 미칠 것으로 예상된다. 지식 노동자의 임무는 창의력을 바탕으로 업무의 생산성을 높이기 위해 끊임없이 새로운 아이디어를 생산하는 것인데, 이런 일은 생성형 AI 기술이 가장 잘하는 분야이기 때문이다.
생성형 AI 시대에 진정한 승자는 생성형 AI 도구를 잘 활용해 ‘건초 더미에서 바늘을 쉽게 찾는 역량’을 갖춘 사람이 되지 않을까. 기계로 대체할 수 있는 인간이 되지 않기 위해서는 생성형 AI 도구와 같은 ‘거인의 어깨 위에 올라타는 전략’이 필요할 것 같다.
김상락 울산연구원 혁신성장연구실 연구위원