今年七月,三立新聞台搭上全球AI主播熱潮,推出以主播陳斐娟為AI虛擬人像原型所打造的「克隆娟」,身為操盤手的集仕多更因此浮出檯面、聲名大噪。
「在克隆娟之前,早在2021年,我們就推出台灣第一個AI主播韓小夏。」談起這波生成式AI崛起,集仕多總經理梁哲瑋強調,公司在這塊領域早已跨足,團隊透過技術不斷地累積,對虛擬主播報時的嘴型、動作與自然光源等掌握深具信心,「在造型方面,我們可以百變,一個禮拜就推出一個,這大概是業界唯一。」他自豪的表示。
談到AI主播的技術來源,梁哲瑋進一步說明,早期打造虛擬主持人屬於3D建模,是請真人穿上十至廿套衣服在綠幕拍攝再後製,但綠幕光源不連續不易自然,如今可運用Stable Diffusion這類預先訓練模型(pretrained models)建立人臉。
Stable Diffusion 是生成式AI新創Stability.ai所發佈文生圖的開源模型,也是目前主流AI動態圖像模型之一,但梁哲瑋透露,生成式AI有一個特色,無論你用ChatGPT或Stable Diffusion同,每次得到答案完全不一樣,這種非連續性的特性,也成為動態圖像生成一大挑戰,「當影像要動的時候你會發現,怎麼穿的是運動服下一秒變穿西裝?整個不連續了!」為此,如何在時間與空間上達到連續一致性結果,就是內部最重要的技術核心,因為非常機密,他低調的不肯明說。
「生成式AI會這麼紅,真的出乎意料,卻順勢推了我們一把。」梁哲偉說,目前,除了三立,近期,華視在亞運期間,推出以體育主播林奕雯為原型的AI主播「E-Win」,也是集仕多團隊的心血,他們憑著這些作品參展屢屢獲勝,日前更吸引輝達(nVIDIA)美國AI繪圖部門主動尋求合作,計畫在影音、影片展開技術策略聯盟,對目前才僅20多人的新創,無疑是一大肯定。
不過,輝達(NVIDIA)今年確實投資了一家提供AI主播服務的生成式AI新創Synthesia,顯示這塊市場不無競爭,梁哲瑋卻認為,Synthesia在市場追捧下已獨角獸,顯示虛擬主播產業受到認同,為了做出區隔,公司將鎖定媒體、商業展覽等2B客群,同時走出國際,目前已切入印尼取得當地展覽會的線上虛擬導覽服務。
生成式AI各種應用正在萌芽,專家提醒,台灣業者須在資料(數據)拿出獨特性,同時,當大家都用開源(open source)模型打造服務,也需在算法加值,才能在雨後春筍般的市場勝出。