當(dāng)前位置:首頁(yè) >  IDC >  云計(jì)算 >  正文

通義萬(wàn)相發(fā)布視頻生成模型,可一鍵創(chuàng)作影視級(jí)高清視頻

 2024-09-19 15:17  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

9月 19 日,在杭州云棲大會(huì)上,阿里云CTO周靖人宣布通義萬(wàn)相全面升級(jí),并發(fā)布全新視頻生成模型,可生成影視級(jí)高清視頻,可應(yīng)用于影視創(chuàng)作、動(dòng)畫(huà)設(shè)計(jì)、廣告設(shè)計(jì)等領(lǐng)域。即日起,所有用戶可通過(guò)通義APP及通義萬(wàn)相官網(wǎng)免費(fèi)體驗(yàn)。

據(jù)介紹,通義萬(wàn)相首批上線文生視頻、圖生視頻功能,在文生視頻功能中,用戶輸入任意文字提示詞,即可生成一段高清視頻,支持中英文多語(yǔ)言輸入,并可以通過(guò)靈感擴(kuò)寫(xiě)功能智能豐富視頻內(nèi)容表現(xiàn)力,支持16:9、9:16等多種比例生成;在圖生視頻功能中,支持用戶將任意圖片轉(zhuǎn)化為動(dòng)態(tài)視頻,按照上傳的圖像比例或預(yù)設(shè)比例進(jìn)行生成,同時(shí)可以通過(guò)提示詞來(lái)控制視頻運(yùn)動(dòng)。

現(xiàn)場(chǎng),阿里云演示了該模型強(qiáng)大的運(yùn)動(dòng)生成和概念組合能力,輸入「穿著滑冰鞋的小兔子在冰面上靈活移動(dòng)的可愛(ài)場(chǎng)景」,通義萬(wàn)相僅用數(shù)分鐘就能生成一段高清、逼真的視頻。

通義萬(wàn)相視頻生成大模型集成了多項(xiàng)創(chuàng)新技術(shù),有效解決畫(huà)面表現(xiàn)力和大幅度運(yùn)動(dòng)等視頻生成技術(shù)難題。針對(duì)運(yùn)動(dòng)生成和物理模擬等難點(diǎn)優(yōu)化算法,實(shí)現(xiàn)了大幅度主體運(yùn)動(dòng)和運(yùn)鏡控制,并有效模擬真實(shí)世界物理特性;設(shè)計(jì)了高壓縮比、高質(zhì)量視頻VAE框架,有效降低視頻信息冗余,并保持高質(zhì)量視頻重構(gòu)能力;同時(shí),基于輕量微調(diào)框架和精選數(shù)據(jù)集優(yōu)化訓(xùn)練,在中式傳統(tǒng)元素、風(fēng)格化視頻生成上表現(xiàn)更好。

去年7月,通義萬(wàn)相圖像生成大模型首次亮相,目前已累計(jì)生成7500萬(wàn)張圖片。云棲大會(huì)現(xiàn)場(chǎng),通義萬(wàn)相宣布視覺(jué)生成大模型全面升級(jí)為Diffusion Transformer框架,同時(shí)結(jié)合通義千問(wèn)復(fù)雜提示詞解釋能力,有效提升畫(huà)面表現(xiàn)力、語(yǔ)義理解能力、可控生成能力。隨著通義萬(wàn)相視頻生成模型的發(fā)布,通義大模型已覆蓋文本生成、圖像理解、視頻理解、音頻理解、圖像生成、視頻生成等全模態(tài)場(chǎng)景。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
通義千問(wèn)

相關(guān)文章

  • 通義千問(wèn)三款主力模型再降價(jià) 最高降幅85%

    9月19日,繼5月首次大幅降價(jià)后,阿里云百煉平臺(tái)上的三款通義千問(wèn)主力模型再次降價(jià)。Qwen-Turbo價(jià)格直降85%,低至百萬(wàn)tokens0.3元,Qwen-Plus和Qwen-Max分別再降價(jià)80%和50%。其中,Qwen-Plus推理能力追平GPT4,可應(yīng)用于復(fù)雜任務(wù),是效果、速度及成本均衡的最

    標(biāo)簽:
    通義千問(wèn)
  • 通義千問(wèn)升級(jí)旗艦?zāi)P蚎wen-Max,性能接近GPT-4o

    9月19日云棲大會(huì),阿里云CTO周靖人宣布,通義旗艦?zāi)P蚎wen-Max全方位升級(jí),性能接近GPT-4o。通義官網(wǎng)和通義APP的后臺(tái)模型均已切換為Qwen-Max,繼續(xù)免費(fèi)為所有用戶提供服務(wù)。用戶也可通過(guò)阿里云百煉平臺(tái)調(diào)用Qwen-Max的API。相比上一代模型,Qwen-Max在訓(xùn)練中使用了更多的

    標(biāo)簽:
    通義千問(wèn)
  • 通義靈碼AI編程能力再進(jìn)化,說(shuō)幾句話就能開(kāi)發(fā)網(wǎng)頁(yè)

    9月19日,在2024杭州云棲大會(huì)上,隨著通義大模型能力的全面提升,阿里云通義靈碼迎來(lái)重磅升級(jí),從一年前只能完成基礎(chǔ)的輔助編程任務(wù),進(jìn)化到幾句話就能完成需求理解、任務(wù)拆解、代碼編寫(xiě)、修改BUG、測(cè)試等開(kāi)發(fā)任務(wù),最快幾分鐘可從0到1完成應(yīng)用開(kāi)發(fā),提升數(shù)十倍開(kāi)發(fā)效率。自去年首次亮相以來(lái),通義靈碼已入職中

    標(biāo)簽:
    通義千問(wèn)
  • 通義千問(wèn)重磅開(kāi)源Qwen2.5,性能超越Llama

    9月19日云棲大會(huì),阿里云CTO周靖人發(fā)布通義千問(wèn)新一代開(kāi)源模型Qwen2.5,旗艦?zāi)P蚎wen2.5-72B性能超越Llama405B,再登全球開(kāi)源大模型王座。Qwen2.5全系列涵蓋多個(gè)尺寸的大語(yǔ)言模型、多模態(tài)模型、數(shù)學(xué)模型和代碼模型,每個(gè)尺寸都有基礎(chǔ)版本、指令跟隨版本、量化版本,總計(jì)上架100

    標(biāo)簽:
    通義千問(wèn)
  • 通義靈碼推出企業(yè)版,底座模型CodeQwen1.5登頂權(quán)威榜單

    5月9日阿里云AI峰會(huì),通義靈碼宣布推出企業(yè)版,滿足企業(yè)用戶的定制化需求,幫助企業(yè)提升研發(fā)效率。通義靈碼是國(guó)內(nèi)用戶規(guī)模第一的智能編碼助手,基于SOTA水準(zhǔn)的通義千問(wèn)代碼模型CodeQwen1.5研發(fā),插件下載量已超350萬(wàn)。通義靈碼熟練掌握J(rèn)ava、Python、Go、JavaScript、Type

    標(biāo)簽:
    通義千問(wèn)

熱門排行

信息推薦