1 / 1
" 영상 생성"으로 검색하여,
3 건의 기사가 검색 되었습니다.
-
2024-11-11▲ 좌측부터 김지환 연구원(협동과정 인공지능전공 석사과정), 강준오 연구원(전기정보공학부 박사과정), 한보형 교수(전기정보공학부, 협동과정 인공지능전공)[출처=서울대학교 공과대학]서울대학교(총장 유홍림) 공과대학(학장 김영오)에 따르면 전기정보공학부 한보형 교수가 지도하는 컴퓨터비전 연구팀(CVLAB)이 혁신적인 인공지능(AI) 기술 ‘피포 디퓨전(이하 FIFO-Diffusion)’을 개발했다.‘피포 디퓨전(이하 FIFO-Diffusion)’은 별도의 학습 없이 무한한 길이의 비디오를 생성할 수 있는 인공지능(AI) 기술이다. 기존 영상 생성 모델의 한계를 극복해 디퓨전 모델에 기반한 비디오 생성기술의 새로운 방법론을 제시했다는 평가를 받고 있다.이 기술을 제안한 논문 ‘FIFO-Diffusion: Generating Infinite Videos from Text without Training’은 2024년 10월 인공지능 및 기계학습 분야의 최고 권위 국제학술대회 ‘NeurIPS 2024 (Neural Information Processing Systems, 신경정보처리시스템학회)’의 발표 논문으로 채택돼 학계와 산업계의 주목을 받은 바 있다.NeurIPS는 인공지능 및 딥러닝 분야의 최신 연구 성과와 혁신적 기술이 발표되는 자리로 매년 엄격한 심사를 통과한 우수한 논문이 발표 논문으로 선정된다.기존의 비디오 생성 모델은 영상 길이가 길어질수록 메모리 소모가 급격히 증가해 대규모 하드웨어 자원이 필요했을 뿐 아니라 프레임 간 일관성 유지에 어려움이 있어 부자연스러운 영상을 생성하는 한계가 있었다.이에 연구팀은 메모리 사용량을 일정하게 유지하면서도 각 프레임이 자연스럽게 연결되는 영상을 생성하는 FIFO-Diffusion을 개발했다.개발된 기술은 사전에 짧은 클립을 통해 훈련된 디퓨전 모델이 추가 학습 없이 텍스트 조건에 맞춰 무한한 길이의 비디오를 생성하도
-
▲ GS리테일(대표 허연수)의 e커머스, 홈쇼핑 브랜드인 GS샵의 인공지능(AI) 스튜디오 [출처=홈페이지]GS리테일(대표 허연수)의 e커머스, 홈쇼핑 브랜드인 GS샵은 2024년 8월5일 업계 최초로 방송 스튜디오에 생성형 AI 기술을 적용한 ‘인공지능(AI) 스튜디오’ 운영을 본격화한다고 밝혔다.2024년 7월 10일(수) ‘핏플랍 샌들’ 방송을 생성형 AI 기술로 구현한 스튜디오에서 진행한 후 패션, 뷰티, 가전, 건강기능식품 등 거의 모든 상품 카테고리에 적용해 총 160여 회를 방송했다.대형 LED 월(Wall)에 생성형 AI 소프트웨어로 만든 세트 이미지가 펼쳐졌다. 넓은 바다가 보이는 파스텔톤 건축물 이미지가 시청자들을 시원한 공간으로 안내했다.조명이 달린 스튜디오 천장은 생성형 AI 기술로 만든 넓고 파란 하늘이 뒤덮었다. 마치 오션뷰 리조트의 로비에서 방송이 진행되는 듯한 느낌을 만들어냈다.이날 방송은 동시간대 홈쇼핑 방송 중 시청률 1위(KT IPTV 기준)를 기록했다. 판매 품목인 핏플랍 샌들 4개 색상 중 그레이 색상은 전체 매진되는 등 총 6300족이나 판매됐다. ‘AI 스튜디오’는 그동안 단계적으로 구축해 온 디지털 기술의 집합체다. GS샵은 2022년 ‘LED 월’을 스튜디오에 도입하고, 2023년 네트워크(IP) 기반 방송 운영 시스템을 마련하며 디지털 스튜디오를 고도화했다.2024년 초부터 방송 기술 직원들이 생성형 AI 소프트웨어를 학습하고 이를 실무에 적용함으로써 ‘AI 스튜디오’ 첫 발을 뗀 것이다.‘AI 스튜디오’를 완성한 덕분에 홈쇼핑 방송은 공간 제약을 극복하고 스튜디오 완성도를 높이는 동시에 업무 효율은 극대화할 수 있게 됐다.배재성 영상제작부문장은 “스튜디오는 방송이 진행되는 공간을 넘어 판매 상품의 브랜드 이미지를 만드는 매우 중요한 역할도 맡고 있다
-
▲ 일본 전기전자 대기업인 NEC 빌딩 [출처=홈페이지]일본 전기전자 대기업인 NEC에 따르면 2023년 12월4일 생성 인공지능(AI)으로 동영상을 인식해 문장으로 표현하는 기술을 개발했다고 밝혔다.AI가 동영상의 내용을 보지 않고 인식해 문장으로 표현할 수 있다. 생성형 AI는 말이나 이미지와 달리 정보량이 많은 동영상을 인식해야 하므로 기술적 난이도가 높다.100개가 넘는 AI가 협력해 동영상에서 인물, 물건 등을 인식한다. 인식 결과는 생성 AI가 정리해 문장에 정돈하는 방식을 적용했다.NEC가 개발한 생성 AI 기술을 활용하면 차량에 장착된 블랙박스 동영상에서 교통사고의 원인도 분석할 수 있다. 동영상을 분석한 결과로 보고서를 작성해 제공한다.건설 현장에서 작업 내용이나 과정을 모두 동영상으로 촬영한 후에 문서로 만드는 것도 가능해진다. 기존에 동양상을 분석하는 기술과는 차별화돼 활용 분야가 대폭 넓어질 것으로 전망된다.
1