본문 바로가기
IT 이야기

OpenAI의 동영상 생성 AI '소라(Sora)' 공개 소식 및 소개

by grabhoho 2024. 2. 19.

 

세상이 변화하는 속도가 정말 무섭습니다. 2년 전 OpenAI에서 chatGPT를 출시했을 때도 한번 써보고 무척 놀랐습니다. 사람과 텍스트로 대화하는 쓸만한 AI가 나올 때까지 수십 년이 걸렸는데 여기서 끝이 아니었죠. 이제는 chatGPT와 실제 음성으로도 대화가 가능합니다.

 

그런데...

 

며칠 전인 2024년 2월 15일 OpenAI가 또하나의 놀라운 서비스를 공개했습니다. 바로 텍스트를 입력하면 동영상을 생성해주는, 간단히 말해 동영샹 생성 AI인 '소라(Sora)'를 공개했습니다.

 


OpenAI의 동영상 생성 AI 소라(Sora) 소개


 

OpenAI Sora 로고
OpenAI Sora 로고

 

 

먼저 OpenAI의 공식 웹페이지에 Sora가 어떻게 소개되고 있는지 한번 살펴볼까요.

 

Sora is an AI model that can create realistic and imaginative scenes from text instructions.

 

 

해석을 해보면 '소라는 텍스트 명령을 통해 현실감있고 상상력 넘치는 장면들을 만들어 내는 AI 모델입니다.'가 됩니다. 좀더 간단히 표현을 해보면 'text-to-video model'입니다.

 

소라(Sora)의 주요 특징

 

소라(Sora)는 현재 최대 1분 길이의 비디오를 만들 수 있으며, 물리적인 움직임을 이해하고 시뮬레이션할 수 있도록 OpenAI에서 학습을 시키고 있습니다.

 

소라(Sora)를 이용해 만들어진 영상 속에는 한 개의 캐릭터(사람이나 동물 등 영상에 나오는 등장인물)만 들어있는게 아니고 여러 개의 캐릭터가 들어갈 수 있습니다. 심지어 앞에서 말씀드린 물리적인 움직임이 학습되어 있습니다. 그래서 공식 웹페이지에서 공개된 영상을 보면 각 캐릭터들 사이에 원근감도 느껴지고, 각 캐릭터들이 현실세계에 있는 것 같은 상호작용하는 모습을 확인할 수 있습니다.

 

소라(Sora)가 풀어야할 문제

 

하지만 아직 해결하지 못한 문제가 있습니다. 복잡한 장면에서는 물리적인 움직임을 정확히 시뮬레이션할 수 없고, 특정한 상황에서 인과 관계를 이해하지 못할 수 있습니다.

 

예를 들어 사람이 과자를 한 입 베어 먹는 영상이 있다고 생각해보겠습니다. 사람이 과자를 한 입 베어먹었으면 그 과자에는 베어먹은 흔적이 남아야겠죠? 그런데 소라(Sora)는 이런 인과관계를 완벽하게 이해하지 못해 과자에 베어먹은 흔적이 없는 영상을 만들 수 있다는 겁니다.

 


소라(Sora)를 지금 사용할 수 있나요?


 

 

안타깝게도 현재 일반 사용자는 사용할 수 없고, 현재 OpenAI에서는 'red teamer'만 사용할 수 있게 했습니다. 'red teamer'는 AI의 취약점을 찾고 더 나아가 AI가 유해한 결과물을 만들지 못하게 하는 조직이라고 생각하시면 됩니다.

 

현재 일반 사용자를 위한 공식 출시일은 공개되지 않았지만 많은 사람들이 이제 동영상도 AI를 이용해 제작할 수 있는 시대가 되었다는 건 꼭 알고 있어야겠습니다.

 

그리고 이런 기술들이 내 직업에 어떤 영향을 끼칠지도 알고 있어야겠습니다. 얼마 전 엔비디아 CEO인 젠슨 황이 이제 모든 사람이 프로그래머가 될 수 있는 시대가 되었으니 프로그래밍 공부를 더 할 필요가 없다고 했습니다. 동일한 맥락에서 영상 제작 관련된 일에 종사하고 있는 분들에게도 많은 영향을 끼치지 않을까 조심스레 예측해봅니다.

 


마치며


 

 

마지막으로 OpenAI 소라(Sora) 공식 웹사이트를 꼭 방문해서, 그 사이트에 공개된 동영상들을 한번 보시기 바랍니다. 입이 떡하니 벌어집니다.

 

https://openai.com/sora

 

Sora: Creating video from text

The current model has weaknesses. It may struggle with accurately simulating the physics of a complex scene, and may not understand specific instances of cause and effect. For example, a person might take a bite out of a cookie, but afterward, the cookie m

openai.com

 

이 웹사이트에 소개된 영상들은 모두 소라(Sora)를 이용해 생성된 이미지이며, 어떤 보정도 하지 않은 영상입니다. 머지 않아 영상 편집 기술이 없는 사람들도 AI를 이용해 크리에이터가 될 수 있는 시간이 머지 않은 것같습니다.


 

오늘 포스팅은 여기서 마치겠습니다 :)

댓글