7月27日,新壹科技在北京举办了“新视界·新壹视频大模型发布会”。会上,新壹科技发布了国内首款聚焦视频领域的大模型“新壹视频大模型”,以及AIGC(生成式人工智能)视频生成平台“秒创视频创作平台”,首款基于商用的数字人平台“新壹数字人平台”,此外,还发布了国内首款明星数字人祝福视频制作产品“秒祝”。
目前,新壹科技的AI(人工智能)生成能力已覆盖文本、图像、音视频等内容模态,是国内AIGC领域布局较为全面、技术较为成熟的公司,实现了从大模型到平台服务再到产品服务落地的AIGC业务全链路打通。
国内首款聚焦视频领域的大模型
新壹科技创始人、董事长韩坤在会上表示,“由于没有从实际场景出发,导致大部分通用大模型的实用性并不强,难以真正重塑实际的生产。我们需要建立一个连接AI技术能力和垂直场景需求的大模型,能够提供释放生产力的能力,并创造更多实际价值的垂直场景大模型。”
为此,新壹科技发布国内首个聚焦在视频领域的大模型——新壹视频大模型。新壹视频大模型是以视频生成为核心的多模态AIGC模型。基于深度学习海量视频样本,新壹视频大模型拥有了从脚本生成、素材匹配、智能剪辑配音到数字人播报的AI全流程视频生产能力。让每个人都能实现高质量、高效率、低成本、无门槛视频创作。
新壹视频大模型具备多模态感知、实时学习、自迭代及多场景交叉推理的核心能力。能够处理多模态的输入信息,可以理解文字的含义,识别图像的内容,感知音乐的情绪,并基于对内容深度准确的理解,生成视频。
新壹视频大模型还采用了自监督学习方案,会通过分析视频的结构、内容、风格等多个维度,自我理解和把握视频制作的规则和逻辑;新壹视频大模型能跨场景进行知识迁移与关联,选择合适素材,调整视频风格,生成满足创作者需求且质量高的视频;新壹视频大模型亦可面向行业级的垂直场景对新壹视频大模型做定向训练,以提供更加精准、专业的服务,满足客户的多样化需求。
实时演示AIGC视频创作全流程
新壹科技现场演示了秒创视频创作平台的操作全过程。秒创是基于新壹科技视频大模型的智能AI内容生成平台。通过秒创平台,创作者可以把一篇文章甚至是一个想法快速地制作为视频,5分钟即可从文案到视频成品。为了达到这样的效果,秒创除了提供图片生成、视频生成、声音生成、数字人生成等AIGC功能外,还提供了一个千万级的结构化视频库为用户提供精准匹配。据悉,秒创试运营半年多以来,已经积累了200多万的用户,每天产出超过10万分钟视频。
新壹科技还发布了数字人平台。通过多模态合成AI技术,该平台可以将真人录制的视频和音频素材,快速生成2D写实数字人。基于新壹视频大模型, 24小时内即可完成一个数字人的训练。通过融合通用语言模型、音视频生成技术,能够快速、低成本地生成真人播报视频和直播,极大降低了真人出镜门槛。新壹数字人平台也可以驱动各种风格的3D数字人形象。目前,数字人行业已经进入了稳定的增长期。新壹科技预计今年中国将至少新增100万个数字人。
此外,新壹科技还发布了明星数字人祝福视频制作产品——秒祝。秒祝通过对明星视频进行训练,将明星的形象和声音完美地还原出来,生成对应的明星数字人形象。最终呈现给客户的是以明星数字人为主角的个性化定制祝福视频。随着全球粉丝经济的快速发展,秒祝产品的市场增速将快速释放。
韩坤表示,在过去将近20年的时间里都在深耕视频行业,有深厚的视频经验和技术积累,培养了一支代码技术过硬的工程师团队,形成了良好的产品服务意识。接下来,新壹科技将推出更多的垂直场景服务平台和产品,比如为政府政务、金融保险、适老养老、智能交互数字人以及游戏等垂直场景提供服务,目前已经有解决方案和产品正在落地。