Midjourney公司计划在未来几个月推出“文本转视频”模型,通过在1月开始培训视频模型,强调其自然发展和在生成视频领域引入竞争动态,同时V6更新提升画质和用户体验。
“O”:视频输出。2023年,我们看到了文字到视频合成的浪潮:WALT(谷歌)、EmuVideo(Meta)、Align Your Latents(英伟达)、Pika等等,数不胜数。然而,大多数生成的片段仍然很短。我将它们视为AI视频的“系统1”——“无意识”的局部像素运动。
大多数情况下,它的性能时好时坏。它不了解你的代码库,经常错误地猜测函数名称。有时它会创建带有细微错误的代码,迫使我花额外的时间分析它的输出。
2. 💼Articul8源于英特尔与波士顿咨询集团(BSG)的合作,构建了一款可读取文本和图像的通用人工智能系统。
此外,M2UGen还加入了适配器和LLaMA2模型,使得该模型具备多种能力。