×

核心技术

Core Technologies

技术概述 Overview

3522集团新网站私域语音大模型VoiceGPT,基于AI+3522集团新网站语音能力,搭载大型的声学模型、语言模型、声学事件处理模型和专业知识库,基于“云++自进化”的核心能力框架,通过多模态语音交互技术,实现第五代人交互技术——自然人机交互,为未来各种信息系统提供新一代的信息接口。



功能及特点 Features
  • 语音识别ASR

    两文三语语音实时和文件转写,中英文混合语音识别

  • 自学习

    秒级快速热词自学习

  • 语音合成TTS

    情感语音合成,多风格语音合成

  • 语音克隆Voice Clone

    快速语音复刻

  • 声纹识别

    有监督和无监督说话人分离

  • 自然语言处理NLP

    关键信息抽取,意图理解,多轮对话管理

  • 音视频联动处理

    声学场景判断(ASC),声音事件检测(AED)噪声监测

  • 工业声学处理

    工业设备声纹检测,声学成像

  • 语音识别ASR

    两文三语语音实时和文件转写,中英文混合语音识别

  • 自学习

    秒级快速热词自学习

  • 语音合成TTS

    情感语音合成,多风格语音合成

  • 语音克隆Voice Clone

    快速语音复刻

  • 声纹识别

    有监督和无监督说话人分离

  • 自然语言处理NLP

    关键信息抽取,意图理解,多轮对话管理

  • 音视频联动处理

    声学场景判断(ASC),声音事件检测(AED)噪声监测

  • 工业声学处理

    工业设备声纹检测,声学成像