阿里巴巴发布了一个音频处理模型:Qwen2-Audio ,它可以通过语音聊天和音频分析两种方式与用户互动。在语音聊天模式下,用户可以与模型进行直接的语音对话;在音频分析模式下,用户可以上传音频文件进行转录分析等。
Qwen2-Audio 能够识别语音中的情感,如愤怒、快乐、悲伤等,为情感计算和用户情感体验提供支持。
Support authors and subscribe to content
This is premium stuff. Subscribe to read the entire article.
Login if you have purchased
一家为专业人士提供基于人工智能的照片和视频增强软件的公司。他们的软件利用深度学习来提高图像质量,包括降噪、锐化、提升分辨率等功能。