
AI音效90秒长时可控生成!“狼嚎2秒,蟋蟀鸣8秒”精准搞定!清华&生数科技新研究入选ACM MM 2025
AI音效90秒长时可控生成!“狼嚎2秒,蟋蟀鸣8秒”精准搞定!清华&生数科技新研究入选ACM MM 2025
文生音频系统最新突破,实现精确时间控制与90秒长时音频生成!
想象一下,给AI发一段复杂指令生成音频:
0-10秒要有森林风吹声;0-4秒,鸟儿鸣叫;4-6秒,木头燃烧;6-16秒,动物踩在干树叶上的脚步声;10-16秒,蟋蟀鸣叫;16-19秒,猫头鹰鸣叫;17-26秒,溪水流淌。
15
0
2025-09-04
