빠른 속도로 발전하고 있는 컴퓨터 비전 기술과 예술

글쓴이 이동엽 / 꿈꾸는 과학-과학동아리

🔑 11분 안에 이런 걸 얻을 수 있어요.

이 글에서는 현재 빠른 속도로 발전하고 있는 컴퓨터 비전 기술에 대해 알아보고

– 컴퓨터 비전 기술이 창의성을 가지고 있는지

– 확인할 수 있는 테스트를 통과할 수 있는지에 대해 다루고자 합니다.

인간의 창의력은 인간에게만 존재하는 고유한 능력으로 인간의 존재 의미를 보여주는 것이라 할 수도 있습니다. 더욱이 이러한 창의성에 기반한 예술 활동은 아직 인공지능이 따라잡을 수 없는 인간만의 영역이라고 대부분의 사람들이 믿고 있습니다.
그러나 2018년 크리스티 경매에서 인공지능이 그린 작품인 ‘벨라미의 초상’이 약 5억 원에 낙찰된 점, 뉴스 기사를 작성하거나 컴퓨터 프로그램도 생성할 수 있는 GPT-3 모델이 등장하고 현재까지도 계속해서 진화를 거듭하고 있는 점 등으로 인해 인간만의 영역에 대한 경계가 허물어지고 있습니다.

뉴욕 크리스티 경매에서 낙찰된 인공지능(AI)의 초상화 ‘벨라미가의 에드몽 벨라미’ [연합뉴스]

인공지능 테스트

과거의 인공지능은 ‘인간이 명령한 것 이상을 제공하지 않는다.’라고 능력을 제한했었습니다.

따라서 인공지능을 개발할 때, 인간이 해석하고 이해할 수 있는 것들을 바탕으로 알고리즘을 설계해야 한다고 여겨졌습니다.

그러나 현재의 인공지능은 스스로 데이터 패턴을 인식하고 인간의 인식 능력을 넘어서는 성능을 보여주며 인간이 제공하는 데이터 이상의 것을 획득하여 결과를 생성하고 있습니다. 또한 인공지능 스스로 학습을 통해 최적의 기능을 획득하고자 하는 경향을 보입니다.

그렇다면 ‘인공지능이 진정으로 창의성을 가지고 있는 것일까?’에 대한 의문을 생기게 됩니다.

이러한 의문을 해결하기 위해 인공지능을 판별하는 테스트들이 고안되었습니다.

기존의 인공지능 테스트 : 튜링 테스트

튜링 테스트는 인공지능의 아버지라고 불리는 앨런 튜링이 1950년 기계의 지능 여부를 판별하기 위해 만든 테스트입니다. 서로 격리된 상태에서 제3자가 사람과 컴퓨터의 대화를 통해 그 둘을 구분하지 못할 경우 시험을 통과하게 됩니다.
현재는 엘리자(Eliza)와 같이 사람의 대화를 흉내 내는 챗봇이 개발되면서 의미가 많이 축소된 상황입니다. 사람처럼 말을 하는 것만으로 기계의 지능 여부를 판별하는 것은 너무 단편적이고 유용하지 않다는 비판이 많이 나오고 있기 때문입니다.

러브레이스 테스트

러브레이스 테스트는 조지아 공대 마크 리들 교수에 의해 고안된 테스트로 튜링 테스트의 대안으로 고안된 테스트입니다. 대화를 통해 판단하는 튜링 테스트와 달리 러브레이스 테스트는 인공지능의 개발자가 설명할 수 없는 방식으로 인공지능이 어떻게 창의적인 아이템을 개발했는지를 판단하는 테스트입니다. 최근에는 러브레이스 테스트 2.0이 나오면서 기존의 테스트가 명확하거나 측정 가능한 매개변수를 확립하지 않았던 점을 보완하고 가치판단 없이 정의된 제약 조건을 사용하여 판단할 수 있도록 하였습니다.

▶3가지 규칙

인공지능은 인간 수준의 지능이 필요하다고 판단되는 예술 장르에서 창의적인 작품을 개발하고 그 작품이 인간 평가자가 부여한 특정 창의적인 제약 조건을 충족하면 통과입니다.
인간 평가자는 창의적인 부분에 있어서 특정 기준을 충족하는지 결정하는 대표자입니다.
인간 평가자는 특정 기준이 불가능한 표준은 아닌지 판단해야만 합니다.

컴퓨터 비전 기술

컴퓨터 비전 기술은 인간의 눈과 뇌를 통해서 처리되는 시각인지 기능을 IT 디바이스와 분석 소프트웨어를 이용하여 실현하는 기술 분야입니다. 인공지능 기술의 한 분야로 시각적인 정보를 수집하여 필요한 상황을 인지하고 최적의 행동을 결정하는 데 있어서 중요한 정보를 생성합니다.
컴퓨터 비전 기술의 가장 단순한 응용은 객체 분류입니다. 하나의 객체를 인식하는 데에서 좀 더 나아가게 되면, 하나의 이미지에 복수의 객체가 존재하고 해당 객체의 위치까지 식별하는 객체 감지 및 위치인식 기술이 있습니다. 좀 더 진화한 형태의 이미지 분석 기술은 이미지가 주어지면 해당 이미지의 상황을 자연어로 생성해 내는 이미지 캡셔닝 기술 분야가 있습니다.

생성하는 인공지능

머신러닝(기계학습)은 구별하는 머신러닝과 생성하는 머신러닝으로 구분할 수 있습니다.

구별하는 머신러닝은 분류와 예측을 주로 수행하는 반면 생성하는 머신러닝은 음악을 만들거나 그림을 그리거나 텍스트를 생성하는 기능을 합니다.

딥드림 (DeepDream)

딥 드림은 2015년 구글 엔지니어인 알렉산더 모드빈체브가 생성한 컴퓨터 비전 프로그램으로 CNN을 이용하여 원본 이미지를 꿈꾸는 듯한 이미지 형태로 전이시키는 프로그램입니다.
원본 이미지의 모호한 부분을 딥러닝 알고리즘이 사전에 인식한 패턴 정보를 바탕으로 과 해석하게 함으로써 결과적으로는 꿈을 꾸는 듯한 이미지를 생성하게 합니다.
이러한 딥 드림 서비스는 다양한 방법을 통해 직접 체험해 볼 수 있습니다.

스타일 전이(neural style transfer)

스타일 전이는 기존의 학습된 CNN 모델을 이용하여 원본 이미지를 스타일 이미지에 맞춰 전이시키는 기술입니다. 스타일 이미지의 스타일에 원본의 이미지 스타일과 콘텐츠 특징 값을 최적화해가는 방법입니다.
스타일 전이에 대한 간단한 체험은 튜토리얼 코드를 통해 직접 실행해 볼 수 있습니다.

https://www.tensorflow.org/tutorials/generative/style_transfer

생성 모델을 이용한 이미지 생성(GAN)

GAN은 특정 수치값을 입력으로 받아 원하는 카테고리의 새로운 이미지를 생성해 내거나 다른 패턴으로 변환하는 기술로 최근 급속도로 발전하여 많은 관심을 받고 활발하게 연구되고 있는 분야입니다. 현재, 사회적으로 큰 문제가 되고 있는 Deep-Fake도 GAN을 이용해 생성되고 있습니다.
인공지능 예술 분야는 GAN의 출현으로 더욱 활기를 띠고 있습니다. 앞에서 언급한 ‘벨라미의 초상’도 GAN을 이용해 만든 예술 작품입니다. 최근에는 예술 작가들도 그들의 커뮤니티에서 인공지능을 이용하여 예술작품을 만들어 내기도 하고 이러한 예술 활동에 대한 신조어 (GAN art, GANism)도 등장하기 시작했습니다.

마치는 글

컴퓨터 비전 기술을 이용한 예술 작품이 그저 기존의 예술작품을 베낀 작품이라고 치부하기에 현재의 기술은 무궁무진한 발전을 이뤘고 그에 맞춰 이에 대한 논의도 이뤄져야 할 것입니다.
인지과학과 계산 주의 심리학 분야를 개척한 마거릿 보든의 말을 인용하자면 창의성에는 세 가지 유형이 있다고 합니다. 첫째는 익숙한 아이디어들을 낯선 방식으로 합쳐보는 것이고 둘째는 관념 공간에 대해 탐구하는 것이라고 합니다. 마지막은 한 단계 더 나아가 관념 공간을 변형하는 것입니다. 위에서 다룬 컴퓨터 비전 기술에 창의성에 대한 세 가지 유형을 적용해 보면 컴퓨터와 창의성 사이에는 무수히 많은 흥미로운 관계가 존재한다고 볼 수 있습니다.
그렇기에 인공지능도 창의성을 가지고 있을 수도 있다는 점을 인정해야 하는 시기가 도래하고 있는 것이 아닌가 싶습니다.

셀렉트스타는 인공지능 데이터의 기준을 만듭니다.

더 정확하고, 깔끔한 셀렉트스타 데이터로 AI를 만들어보세요!

참고자료

마거릿 A.보든, 창조의 순간, 21세기북스, 2010

김말희, 컴퓨터 비전 기술과 예술, 2021

성낙환, 인공지능 기술의 걸음마가 시작되었다, 2012

The Kurzweil Library, Georgia Tech professor proposes another alternative to the Turing test, 2014

인공지능의 새로운 성장과 발전을 경험하세요.

서비스 알아보기

셀렉트스타의 여정에 함께 하고 싶나요?

채용 안내 알아보기

AI 데이터 데이터셋 데이터셋 기준 셀렉트스타 예술 인공지능 창의력 컴퓨터 비전