과거에 인공지능의 발전은 "육체적인 활동"을 대체할 것이라 생각했습니다. 하지만 현재 인공지능의 발전을 보면 "창의적 영역"을 대체하고 있죠. 그렇다면 인공지능은 실제로 사람보다 창의적일까요? 사람들이 만들어온 결괏값을 학습하고, 해당 데이터를 조합해서 도출하는 창의성은 얼마나 우수할까요?
물론 Nature의 실험은 2023년에 진행된 내용으로 GPT-4o에 대한 내용은 아니고, 현재의 AI 모델을 반영하 수 없지만, 인공지능의 창의성을 확인할 수 있는 좋은 실험입니다.
실험 방식.
해당 실험에서는 256명의 참여자와 GPT3.5, GPT4, Copy.AI가 실험에 참여했습니다. 참가자들에게는 일상적인 물건을 주제로 창의적인 대안 용도를 작성하는 것을 기준으로 실험됐습니다. 그리고 각 물건의 대안 용도의 답변은 사람들이 답변의 수, 창의성, 사용된 단어의 수를 기준으로 평가가 됐습니다. 여기서 단어의 수는 아이디어를 더 상세하게 설명한 것을 의미하게 됩니다.
참가자들에게 주어진 주제는 총 4가지로 로프(rope), 상자(box), 연필(pencile), 양초(candle)입니다. AI가 아닌 참가자는 각 물건에 대해 3분 동안 대안 용도를 작성할 시간을 주어졌죠.
실험 결과.
대체로 인공지능은 일반적인 사람과 유사하거나, 더 높은 결과를 만든다.
1
해당 이미지에서 상자 영역은 변동성을 나타냅니다. 상자 안의 중앙선은 각 그룹의 평균값을 나타내죠. 그리고 이미지의 점은 각 개별 응답에 대한 점수를 나타냅니다.
즉, 사람의 답변은 대체로 높은 변동성을 갖고 있으며, 답변의 편차가 굉장히 크게 차이가 납니다. 반면 인공지능의 경우에는 낮은 편동성과 답변의 편차가 크지 않죠. 게다가 중앙값을 기준으로 볼 경우 모든 주제에서 사람을 뛰어넘었습니다.
의미상 거리(Semantic distance)가 아닌, 주관적 평가(Subjective score)에 대한 값을 기준으로 볼 경우, 최대 점수를 기준으로 할 경우 모든 AI 모델이 사람의 평균보다 우수한 값을 나타냅니다. 평균 점수를 기준으로 산출할 경우에도 대부분 사람보다 우수한 결과값을 만들어내죠.
그 외로 주목할 수 있는 점은 GPT-3.5와 GPT-4의 성능 차이입니다. 2023년 3월에 출시된 GPT-4가 이전 모델인 GPT-3.5보다 확연히 높은 결과값을 보이고 있는 점입니다. GPT-3.5는 2022년 11월에 출시되었고, 5개월 후 출시된 GPT-4의 성능이 월등히 높은 점을 알 수 있죠. 현재 GPT-4o는 이전보다 얼마나 높은 창의성을 보여주고 있는지 짐작할 수 있는 부분입니다.
그럼에도 일부 사람들은 우수한 결과를 만듭니다.
모든 이미지에서 개별 점수인 점을 확인할 경우, 늘 최상위의 답변을 낸 것은 사람입니다. 실제로 사람들의 답변은 편차가 크지만, 누군가는 굉장히 높은 창의성을 발휘하는 것을 알 수 있습ㄴ디ㅏ. 사람 중에서도 높은 창의서을 가진 스페셜리스트(Speciallist)들은 언제나 우수한 결과를 만들 수 있는 점을 알 수 있습니다.
하지만 일반적인 사람(Generallist)는 아쉽지만, 인공지능보다 비슷하거나 우수할 수도 있습니다. 더 안좋은 경우 인공지능보다 낮은 결과를 만들 수도 있죠. 그렇다면 우리는 이 실험을 어떻게 바라보고, 어떤 생각을 가져야 할까요?
인공지능은 우수합니다. 그러니 잘 이용해야 합니다.
실험을 기준으로 볼 경우 인공지능은 대체로 사람보다 우수합니다. 만약 내가 특정 분야의 스페셜리스트라면 걱정할 것이 없지만, 일반적인 사람이라면 직업의 존폐를 걱정해야 할 수도 있습니다. 하지만 반대로 생각하면, 우리는 언제나 "중간값"의 결과를 먼저 얻을 수 있습니다. 그리고 그 결과에서 더 발전시킬 수 있죠.
즉, 내가 제너럴리스트라면 우선 인공지능을 활용해서 1차적인 아이디어나 결과값을 얻고, 그 답변을 발전시킬 수 있습니다. 그렇다면 실험에서 나오는 중앙값 아래의 결과물을 줄이면서 더 나은 결과를 만들 수 있겠죠.
우리가 생각해야할 점은 인공지능은 일반적인 사람보다 창의적인 것을 인정하고, 인공지능을 활용해 어느 정도 보장된 결과를 얻은 후 어떻게 더 발전시킬 것인가를 생각해야 합니다.
마케팅이라면 마케팅 카피라이팅을 인공지능에게 우선 얻은 후, 해당 답변을 조합해서 발전시킬 수 있겠죠. 보고서의 인사이트를 뽑는 일 또한 인공지능이 확인하는 인사이트를 보고, 새로운 관점을 더해 더 나은 인사이트를 제시할 수도 있습니다.