(相關(guān)資料圖)
近日,微軟發(fā)布了一款名為可組合擴(kuò)散模型(CoDi)的人工智能模型。這是一種獨(dú)特的、基于可組合擴(kuò)散的人工智能模型,其設(shè)計(jì)目標(biāo)是互動和生成多模態(tài)內(nèi)容。 微軟設(shè)計(jì)CoDi的目標(biāo),是為了解決傳統(tǒng)單一模態(tài)AI模型的局限性。例如,在同步視頻和音頻的情況下,獨(dú)立生成的信息流拼接在一起時(shí)可能存在不一致和對齊的問題。CoDi采用了獨(dú)特的可組合生成策略,在擴(kuò)散過程中對齊多模態(tài),從而生成相互交織的模式。更重要的是,CoDi能夠處理任意輸入模式并生成任意模態(tài)的內(nèi)容。 CoDi是由微軟Azure認(rèn)知服務(wù)研究團(tuán)隊(duì)與北卡羅來納大學(xué)教堂山分校合作開發(fā)的,也是微軟項(xiàng)目i-Code的一部分,該項(xiàng)目使用人工智能來增強(qiáng)人機(jī)交互。對此項(xiàng)目感興趣的用戶可以深入了解。