1)视频图像中的目标检测,分析与识别;
2)可用于MTV歌词分析,合法性审查、安全性审查的自然语言理解技术预研;结合自然语言大模型,语音识别与语音合成技术,可用于驱动虚拟人(虚拟DJ、虚拟主持人)的自然语言对话交互技术预研;
3)可用于指导音质优化、演唱智能推荐、智能VJ实时调光、音频质量分析、评估与优化的音乐音频大模型构建及音频特征分析技术预研。
所属领域
未知项目类型
未知技术水平
未知合作方式
未知1)视频图像中的目标检测,分析与识别;
2)可用于MTV歌词分析,合法性审查、安全性审查的自然语言理解技术预研;结合自然语言大模型,语音识别与语音合成技术,可用于驱动虚拟人(虚拟DJ、虚拟主持人)的自然语言对话交互技术预研;
3)可用于指导音质优化、演唱智能推荐、智能VJ实时调光、音频质量分析、评估与优化的音乐音频大模型构建及音频特征分析技术预研。
全部评论