생성형 AI 서비스 활용

2016년 알파고가 세계 바둑 챔피언을 이긴지 불과 10년도 지나지 안은 현재 인공지능(AI)은 우리의 일상의 많은 부분에 스며들었습니다. 챗봇, 스마트폰, 자율주행 차량의 기능 및 소비자 만족을 위해 사용하는 도구에 이르기까지 모든 것에 영향을 미치고 있습니다.

이러한 인공지능의 발전은 클라우드 컴퓨팅, 빅데이터, 다양한 학습모 의 발달로 그 성능을 가늠하기 어려울정도로 발전을 하였습니다.

최근 Open AI사에서 발표한 chatGPT는 또한번 사람들의 관심을 끌었고 이러한 생성형AI는 여러분야에서 활용이 가능하여 전세계인들의 관심을 사라잡고 있습니다. 누구나 이를 활용하여 새로운 컨텐츠를 생성할 수 있고 업무나 학술 등 다양한 분야에서 적용하고자하는 시도들이 있습니다.

생성형AI에 대한 간략한 개요와 설명 그리고 이를 활용하는 사례, 주의사항 및 기업에서 도입시 고령해야할 사항에 대해 살펴보고자 합니다.

I. 생성형AI의 개요

최근 chatGPT를 사용하여 검색이나 질의응답, 문서작성 등 다양한 용도로 다들 사용해 보셨을텐데요. 이런 chatGPT는 생성형AI의 대표적인 서비스 입니다.

생성형 AI란 인공신경망을 이용하여 새로운 데이터를 생성해내는 기술로 기존 대규모 데이터 패턴을 스스로 학습하여 명령어(prompt)를 통해 사용자의 의도를 스스로 파악하고 텍스트, 이미지, 오디오, 비디오, 코드 등 새로운 콘텐츠를 생성해내는 인공지능입니다.

생성형 AI를 정확하게 이해하기 위해서는 생성형 AI가 등장하기까지의 AI와 관련하여 인공기술의 발달과정을 살펴볼 필요가 있습니다. 우선 인공지능 개념이 가장먼저 등장하였습니다.. 인공지능(AI, Artificial Intelligence)은 말 그대로 인간의 뇌 신경망을 모방하여 인간이 뇌를 통해 수행되는 행위들을 컴퓨터나 기계가 할 수 있도록 만드는 기술을 의미합니다.

이후 많은 양의 데이터를 제공하여 명시적으로 프로그래밍하지 않고 신경망과 딥 러닝을 사 용하여 시스템이 자율적으로 학습하고 개선하는 좀더 능동적인 개념의 AI 기술인 머신러닝(Machine Learning) 개념이 등장했습니다. ‘머신러닝(Machine Learning)’은 2000년대에 들어서 시작된 인공지능을 구현하는 방법의 하나로 빅데이터를 스스로 분석하고, 그 내용을 바탕으로 결론을 도출하는 기술입니다.

그후 2010년 이후 컴퓨터 지능을 한 차원 더 높인 개념으로 머신러닝의 한 방법인 ‘딥러닝(Deep Learning)’ 급성장 하였습니다. 딥러닝의 기본 원리는 1980년대에 이미 나왔습니다. 하지만 학습을 위해서는 무수히 많은 양의 데이터가 필요하고, 그 데이터를 처리할 수 있는 많은 계산이 필요하기 때문에 당시에는 적용이 어려습니다. 하지만 2010년대 이후 하드웨어인 GPU, 빅데이터 및 성능을 높일 수 있는 새로운 계산 방법들이 연구되어 한층 더 빠르게 발전하였습니다.

이러한 종합적인 기술들의 발달을 기반으로 2020년대 들어 한층 더 대중에게 와닿을 수 있는 서비스 기술인 ‘생성형 AI’라는 세부 AI 기술까지 등장하게되었습니다.

Ⅱ. 생성형AI의 핵심 모델, 파운데이션 모델

생성형 AI의 핵심에는 파운데이션 모델이 있습니다. 이 파운데이션모델은 방대한 양의 폭넓은 데이터를 사용하여 자기 지도학습을 통해 방대한 내부 파라미터를 지닌 모델을 학습 시킨 후 , 아직 명확하게 수행해야 할 작업이 정해지지 않은 상태로 배포되어, 사용자가 원하는 목적에 맞게 다운스트림 작업에 대해 미세조정이나 문맥 내 학습(In-context learning)등과 같은 과정을 거침으로서 완성되는 기초모델이라고 볼 수 있습니다.

파운데이션 모델은 다음과 같은 특징을 가지고 있습니다. 우선 파운데이션 모델은 텍스트 혹은 이미지 데이터 자체에 대한 일반적인 이해를 획득하기 위해 방대한 양의 데이터를 자기 지도학습기반으로 학습합니다. GPT-3의 경우 약 5000억 단어 토큰에 가까운 텍스트 데이터가 사용되었습니다.

이런 방대한 양의 학습은 창발성과 균일화의 특징을 가집니다. 창발성은 모델이 스스로 어떠한 문제를 해결하기 위한 방법을 도출하는 능력을 말합니다. 모델이 스스로 수행해야할 작업을 파악하고 해당 작업을 해결하는데 필요한 지식을 도출할 수 있게 되었습니다. 이러한 창발성은 연구자들에 의해 입력되거나 학습데이터로써 주어지지 않았으며, 심지어 연구자들이 미리 예션한 능력도 아니었습니다. 균일화는 모델이 점차 일반화된 지식을 도출할 수 있게됨에 따라 하나의 뛰어난 모델이 적용될 수 있는 범위가 확대되며 더욱 보편적이고 범용적으로 활용되는 현상을 의미합니다.

마지막으로 파운데이션 모델은 기술적 측면에서 트랜스포머 아키텍처 구조를 기반으로 하고 있다는 특징을 갖고 있습니다. 트랜스포머 아키텍처는 텍스트, 이미지, 음성, 정형데이터, 단백질의 염기서열 분석, 분자구조 분석, 강화학습 등의 서로 다른 작업에 대해서 광범위하게 활용되고 있을 뿐만 아니라, 여러 종류의 서로 다른 모달리티에 걸친 데이터를 다루는 멀티 모달 모델의 형태로 발전하고 있습니다.

<출처 > on the opportunities and risks of foundation models, 2021

[그림 1] 파운데이션 모델

이러한 파운데이션모델을 기반으로 여러 AI 개발사들은 개발하고자 하는 서비스의 목적에 따라 다양한 생성형 AI 모델을 개발하고 적용하고 있습니다.

Ⅲ. 생성형 AI 서비스의 종류

생성형 AI의 대표적인 서비스로 ChatGPT가 있습니다. ChatGPT는 인공지능 연구소인 Open AI 사에서 개발한 대화형 챗봇으로 명령 프롬프트에 필요로 하는 주제에 대한 질문을 하면 사람이 제공해 주는 것처럼 답변해주는 채팅 서비스입니다. 질문의 구체성에 따라서 기존 검색에서 제시되는 내용보다 수많은 정보를 포함하여 수준 높은 내용을 가공하여 제시해 줍니다. 이는 대규모 언어 모델을 기반으로 수많은 사람들의 언어와 대화 패턴을 학습하여 이용자의 질문 문구에 따라서 사람이 제공하는 최대한의 대화 내용 및 사람이 만들어 낸 것 같은 창작물을 만들어 냅니다.

다른 서비스로는 구글에서 공개한 최신 대규모 언어모델 ‘팜2’(PaLM2)를 탑재한 대화형 인공지능 Bard가 있습니다. 5300억 개 매개변수(파라미터)로 만든 팜2는 100개 넘는 언어를 지원하며 과학·수학 추론을 넘어 20여개 개발 언어로 코딩 작업도 할 수 있다고합니다.

국내에서는 네이버의 연례 개발자 콘퍼런스 데뷔(DEVIEW)에서 오픈AI의 챗GPT에 맞서기 위해 2023년 안에 네이버 서치 GPT 출시를 예고하였습니다. 네이버의 서치GPT는 초거대 AI ‘하이퍼클로바’를 기반으로 합니다. 한국어로는 고품질 검색 데이터를 가장 많이 보유하고 있다는 특징이 있습니다.

바이두가 2023년 3월 챗GPT와 유사한 챗봇 ‘어니봇’ 업그레이드 모델을 선보일 계획이다. 어니봇은 바이두가 2019년 언어 이해와 생성, 텍스트-이미지 생성 등 광범위한 작업을 처리할 수 있는 AI입니다.

[표 1] 생성형 AI를 활용한 서비스

서비스주요특징보유 초거대 AI기업
Chat GPT대화형 AI 챗봇, 친화적 상호작용을 통해 질문을 이해하고, 필요로하는 정보 제공GPT3.5Open AI(미국)
Bard향후 수 주 내 출시 예정. 챗GPT와 비슷한 기능이나 챗GPT와 달리 최근에 일어난 일에 대해서도 답변 가능LaMDAGoogle(미국)
SearchGPT생성형 AI. 상반기 출시 예정. 요약 정보가 필요한 검색은 다양한 콘텐츠를 활용한 답변 제시하이퍼클로바네이버(한국)
ETNIE챗GPT와 유사한 AI 챗봇 3월 출시 예정. 독립형 애플리케이션 출시 후 기 존 검색 엔진과 통합 예ETNIEBaidu(중국)
<자료> 4차산업시대의 생성형AI 활용가이드, 충청남도 데이터담당관, 2023

이런 다양한 생성형 AI 서비스를 이용하여 다양한 분야에 활용할 수 있습니다.

Ⅳ. 생성형 AI 서비스의 활용 사례

1. 글쓰기

생성형 AI는 인간의 글쓰기를 모방하는 실력이 상당합니다. 기본 인사말부터 역할부여까지 다양한 길이와 문체로도 글을 쓸수도 있습니다.

1) 인사말 작성

예시 1)Q. 내가 AI 활용 방법을 발표할건데 인사말을 100자이내로 만들어줘

A. 안녕하세요! 인공지능을 활용한 혁신적인 방법에 대해 소개합니다. 비즈니스, 교육, 의료 등에서의 실제 사례와 경험을 공유하며, 효과적인 AI 활용 전략을 탐구해봅시다. 함께 미래를 위한 도약을 시작해봐요! 감사합니다.

2) 역할부여

예시 2)Q. 너는 유치원 선생님이야. 유치원생들에게 횡단보도를 건너는 법을 알려줘

A. 안녕, 친구들! 횡단보도를 건너는 건 중요해. 먼저 길을 올바르게 보고, 운전자에게 손을 흔들어봐. 그리고 건널 때는 뛰지 말고, 걸음걸이에 주의해야 해. 함께 안전하게 건너자! 꼭 선생님들이나 어른의 도움을 받으면 좋아. 건널 때는 항상 주의해야 해

3) 번역활동

예시 3)Q. 생성형 AI란 인공신경망을 이용하여 새로운 데이터를 생성해내는 기술입니다 라는 문장을 영어, 일본어, 중국어로 번역해줘

A.영어:Generative AI is a technology that utilizes artificial neural networks to generate new data.   일본어:生成型AIは、人工ニューラルネットワークを使用して新しいデータを生成する技術です。   중국어 (간체字):生成型人工智能是一种利用人工神经网络生成新数据的技术。

2. 아이디어 얻기

최근에 여러 기업에서는 일하는 문화의 혁신의 하나로 생성형 Ai를 활용한 방안을 도입하고 있습니다. 그 대표적인 얘로 기안 문서를 작성 시 초안에 대한 아이디어를 확보하는 차원에서 생성형 AI를 활용하고 있습니다

1) 보고서 작성 질문으로 초안 작성 시 참고

예시 1)Q. 금융권 디지털전환의 필요성 보고서 초안을 작성해줘

A. [보고서 초안]
제목: 금융권 디지털 전환의 필요성 보고서
1. 서론
금융 산업은 빠르게 진화하고 있는 디지털 기술의 영향을 크게 받고 있습니다. 이러한 변화에 대응하여 금융권에서 디지털 전환을 통한 혁신이 필요하다고 판단됩니다.
2. 배경
2.1 기술의 발전과 디지털 기술의 보급
… 생략 …
5. 결론
금융권 디지털 전환은 현재와 미래의 금융 기업이 성공적으로 존속하고 발전하기 위한 필수적인 과정입니다. 디지털 전환의 성공은 기술 도입 뿐만 아니라 조직 전반에 걸친 전략적이고 체계적인 노력이 필요합니다. 앞으로의 빠른 변화에 대응하기 위해 금융 기업은 적극적으로 디지털 전환을 추진해야 할 것입니다.

2) 아이디어 참고

예시 1)Q. ESG를 위한 작은 실천 아이디어를 3개 줘

A.
1. 쓰레기 줄이기와 재활용 촉진:
– 개인 생활에서 사용하는 일회용품을 최소화하고 재사용 가능한 제품을 선호합니다.
– 플라스틱, 종이, 금속 등을 적절히 분리수거하여 재활용에 기여합니다.
2. 에너지 효율적인 습관 채택:
– 전등, 전자제품, 난방 및 냉방 장치 등의 에너지 소비를 줄이기 위해 습관을 개선합니다.
– 에너지 효율 등급이 높은 가전제품을 선택하여 사용합니다.
3. 가능한 교통 수단 이용:
– 대중 교통, 자전거, 도보 등 친환경적인 교통 수단을 적극적으로 활용합니다.
– 근처 목적지에는 가능하면 자가용 대신 대중 교통을 활용하여 대기 오염과 온실 가스 배출을 줄입니다.

3. 코드 생성 및 검증

일부 생성형 AI 툴은 소프트웨어 개발자를 지원하기 위해 요청 시 작성된 프롬프트를 가져와 컴퓨터 코드를 출력할 수 있습니다.

1) 엑셀 함수 출력

예시 1)Q. 엑셀 A열에 값이 ‘남자’면 B열에 1, 엑셀 A열에 값이 ‘여자’면 B열에 2가 입력되는 함수를 만들어줘

A. 엑셀에서 조건에 따라 값을 입력하는 함수로는 IF함수를 사용할 수 있습니다. 아래는 A열이 ‘남자’이면 B열에 1, ‘여자’이면 B열에 2가 입력되는 함수의 예시입니다.


위의 예시에서 A1은 기준이 되는 셀입니다. 이 함수는 A열의 값이 ‘남자’이면 B열에 1을, ‘여자’이면 B열에 2를 입력하며, 그 외의 경우에는 아무것도 입력하지 않습니다.
이 함수를 적용하려는 범위에 맞게 수정하여 사용하시면 됩니다.

2) 프로그램 코드 작성

예시 1)Q. 1개 파일의 데이터를 읽어 전처리하는 파이썬 코드를 생성해줘

A. 파일을 읽고 전처리하는 코드는 파일의 형식과 내용에 따라 다르게 작성됩니다. 일반적으로 텍스트 파일 또는 CSV 파일을 다루는 경우가 많으므로, 이에 맞춘 간단한 예제 코드를 제공해 드리겠습니다.
아래는 CSV 파일을 읽고 간단한 전처리를 수행하는 파이썬 코드입니다. 코드 실행 전에 pandas라이브러리가 설치되어 있어야 합니다. 만약 미설치 상태라면 pip install pandas를 실행하여 설치할 수 있습니다.
 

4. 이미지 생성

생성형 AI 이미지 툴은 프롬프트에 대한 응답으로 고품질 사진들을 합성하여 무수히 많은 피사체와 스타일을 생성할 수 있습니다. Dall·E, Midjourney 등과 같은 AI 툴은 기존 작품에 새로운 요소를 추가할 수 있습니다.

예시 1)Q. 달빛 아래 호수를 바라보는 여인의 그림을 유체화로 그려줘

A.

5. 동영상 생성

작성한 스크립트나 기사의 URL을 입력하면 영상을 자동으로 만들어주는 생성형 AI 이미지 툴은 프롬프트에 대한 응답으로 최적의 이미지와 영상을 합성하여 동영상을 생성할 수 있습니다.

생성형 AI를 활용하여 다양한 방식으로 업무나 일상 생활에 적용할면서 어떻게 하면 더 잘 활용할 수 있을지 살펴보겠습니다.

Ⅴ. 생성형 AI를 잘 활용하려면

생성형AI는 다양한 정보를 학습하여 사용자의 질문에 대해 사용자의 의도를 스스로 파악하고 그 의도에 맞게 보편 타당한 답변을 제시합니다. 같은 의도더라도 사용자가 입력하는 질문에 따라 다양한 답변이 가능합니다. 그래서 원하는 답변을 빠르고 정확하게 얻기위해서는 질문을 잘하는 기준과 방법을 익혀야합니다.

두번째로 생성형AI는 확률에 기반하여 대답을 생성하는 특성상 답변의 부정확성이 존재할 수 밖에 없습니다. 거짓답변을 사실처럼 하는 환각현상이 발생합니다. 여기서 환각의 종류에는 최신 정보 답변불가, 편한된 답변(인종, 성별, 국적 등), 상식 및 추론능력 부족, 수학연산 취약 등이 있습니다. 이러한 환각현상을 줄이기 위해 LLM(Large Language Model)서비스 단에서 다양한 시도(모델의 고도화, 최신 데이터 학습, 인터넷 검색, 플러그인 등)가 이루어지고 있습니다. 하지만 단기적으로 정확한 답변을 위해서는 사용자의 보완이 필요합니다.

앞으로 생성형AI를 본인의 업무에 적용하여 활용하는것이 보편화될 것입니다. 이런한 일하는 방식의 변화에 빠르게 적응하고 준비하는 자세가 필요합니다.


[참고문헌]

[1] 4차산업시대의 생성형 AI 활용가이드, 충청남도 데이터담당관, 2023

[2] https://www.newspim.com/news/view/20230310000056

[3] 윤상혁, 양지훈(2021), AI와ㅣ 데이터 분석 기초: 디지털비즈니스 생존전략, 박영사

[4] [Digital Insight 2023-1] 파운데이션 모델의 이해와 미래 전망, 한국진흥화연구원,

[5] On then Opportunities and Risks of Foundation Models, 2021