작년은 LLM(large language model)의 시대였습니다.
재작년 말 ChatGPT의 등장 이후 사회적으로 가장 많은 관심을 받았던 것은 OpenAI의 ChatGPT, Meta의 llama, google의 bard, gemini 등등.. 대부분 언어 모델이 가져갔죠.
그렇다면 올해의 키워드는 과연 무엇이 될까요? 가능성이 있는 3가지를 간단히 예상해 보겠습니다.
1. 음성
2년 전 이미지 1년 전 언어 그렇다면 올해 음성이 완성된다면 진정한 ai로만으로 만들어지는 콘텐츠를 만나볼 수 있을 것 같습니다.
음성의 경우 작년 여름부터 많은 모델과 논문이 공개 되고 있고, 유명 가수나 해외 가수의 음성으로 노래를 부르는 콘텐츠도 많이 나오고 퀄리티도 상당히 괜찮게 나오고 있습니다.
심지어 노래를 부르지 않는 유튜버의 목소리 데이터만 가지고도 수준급 퀄리티의 영상도 나오고 있는걸로 봐서, 데이터가 거의 없는 일반인도 본인의 음성 ai 모델을 만들 수 있는 날이 금방 올 것 같습니다.
2. 3D 모델링
애플이 또 다시 새로운 시장을 개척하고 있죠. 바로 애플 비전프로로 MR(AR+VR) 시장을 개척하려 하고 있는데 비전프로가 올해 2월 출시 예정입니다.
(AR은 증강현실(현실 공간 + 가상 물체 ex. 포켓몬 고), VR은 가상현실(가상 공간 + 가상 물체 ex. VR Chat))
MR이 나온지 한참 되었지만 아직 제대로 즐길 콘텐츠는커녕 심지어 경험해 볼 수 있는 공간도 경험해 본 사람도 매우 없는 상황이지만, 뭔가 애플이 시도한다고 하면 뭔가 기대가 되는 건 없지 않군요.
애플이 3d 캐릭터 모델링에 대한 논문도 공개하고, 온디바이스 모델도 슬슬 얘기가 나오는걸 보면 AI 모델이 탑재된 MR환경은 좀 기대가 되는군요.
(사진 출처: https://www.mk.co.kr/news/it/10904392 )
3. 멀티 모델
ChatGPT도 그렇고 Gemini도 그렇고 슬슬 완성형 멀티 모델들의 냄새가 나고 있습니다.
멀티 모델이란 여러 가지 입력 뭐 사진이나, 음성이나, 문자를 받고, 대답 또한 여러 가지로 해주는 모델입니다.
즉, 언어로 질문을 하고 언어로 답변하는 챗봇에서 벗어나서, 음성으로 질문하고 음성으로 대답 받고, 사진을 물어보고 대답하고, 계획서를 보여주면 프로그램을 만들어주는 모델.
만약 완성형 멀티 모델이 나온다면 엄청나게 많은 메뉴가 있는 뷔페처럼, 어떠한 사업, 검색을 하더라도 여기저기 찾아다니고 검색하지 않고 한 곳에서 그저 해달라고 해도 되는 시대가 올지도 모르겠습니다.
'인공지능 > 정보 정리' 카테고리의 다른 글
ChatGPT 대항마 Gemini에 대한 논란 정리 (0) | 2023.12.19 |
---|