您的位置: 首页 > 实时讯息 >

生数科技发布高可控视频大模型Vidu Q1:可精准调整所有动作行为

0次浏览     发布时间:2025-03-29 18:02:00    

IT之家 3 月 29 日消息,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军今日发布了高可控视频大模型 Vidu Q1,官方宣称其为业内首个高可控 AI 视频大模型

IT之家从官方获悉,Vidu Q1 在多主体细节可控(特别是动作、布局可控)、音效同步可控、画质增强等方面均取得显著成效。以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1 支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控对所有动作行为(出场、退场、坐立姿态、行动路线)进行精准调整

其支持音效同步可控功能,可确保随着视频环境与画面转场,Vidu Q1 能够输出生成相应音效,并可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,如 0-2s 风声、3-5s 雨声等

相关文章

全国首个交通基建垂类大模型·灵筑智工亮相

工人日报-中工网记者 甘皙6月12日,成都首届垂类大模型产业大型活动——“大模型・全连接・新增长”城市论坛落幕。现场重磅发布得助大模型平台3.0、得助智能音视频服务平台3.0两大技术平台底座,推出银行、证券、汽车三大行业垂类大模型解决方案,并联合宁夏交建交通科技研究院正式发布全国首个交通基建垂类大模
2025-06-13 16:23:00

拉萨贡嘎国际机场最新消息

近日,拉萨贡嘎国际机场T3航站楼迎来智慧安检新成员——AI智能判图设备,在旅检通道正式投入试点运行,这是西藏机场集团首次引入此类人工智能安检技术,开启了安检智能化升级新篇章。AI智能判图设备作为拉萨机场智慧安检建设的核心成果,拥有深度学习功能和图像识别算法,能对X光机传输的行李图像进行毫秒级智能解析
2025-06-13 14:45:00

韦东奕发声:不会再做任何回应

近日,北大数学科学学院教师韦东奕因为入驻短视频平台并发布一条视频,引起舆论关注。北大数学院有关负责人9日称,校方非常关心其健康,将帮助他积极进行治疗,同时希望和网友共同保护好学者专心治学的宁静环境。据红星新闻报道,近日,记者在韦东奕的办公室见到了韦东奕本人。记者眼中的韦东奕无论是发型还是衣着都很整洁
2025-06-12 09:39:00

龙里醒狮镇:“三化” 解码和美乡村,抒写生态振兴答卷

为全面提升农村人居环境质量,建设宜居宜业和美乡村,近期以来,龙里县醒狮镇紧扣“两清两改两治理”核心任务,以新时代文明实践为抓手,以“体系化引领+精准化落实+长效化保持”工作格局,推动乡村实现从旧貌到新颜的华丽转身,为乡村振兴注入强劲动力。体系化引领,构建“专班+机制+目标”三维支撑坚持系统思维,为“
2025-06-11 19:56:00

用户反映Switch 2出现电池鼓包问题,任天堂已启动调查

IT之家 6 月 10 日消息,任天堂 Switch 2 已正式发售,然而在众多玩家享受这款新游戏机带来的乐趣的同时,却有部分用户反映了一个令人担忧的严重问题 —— 电池膨胀导致后盖鼓包,这可能引发火灾和爆炸危险。IT之家注意到,Reddit 上的 r / NintendoSwitch 社区用户“t
2025-06-10 12:06:00

看好公司前景和未来发展 一脉阳光核心高管自愿锁定股份

作为国内最大的第三方医学影像服务平台,一脉阳光(02522.HK)正通过"传统影响医疗+数据智能"的深度融合,打造医学影像全产业链服务平台,重塑行业未来格局。6月9日,公司发布公告,董事长及两位执行董事承诺至12月31日不减持。坚定看好公司前景和未来发展。聚焦三大增长极,夯实传统医疗智能化核心底盘通
2025-06-09 10:42:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5