Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
Whisper 是Openai 开源音频转文字的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
Whisper有五种模型尺寸,提供速度和准确性的平衡,其中English-only模型提供了四种选择。下面是可用模型的名称、大致内存需求和相对速度。
FaceChain是一个可以用来打造个人数字形象的深度学习模型工具。用户仅需要提供最低一张照片即可获得独属于自己的个人形象数字替身。
Documate是一款针对站内文档问答的开源 AI 工具,旨在将 AI 聊天对话框无缝嵌入到您的网站之中。
一个高度可控的虚拟模特服装试穿开源工具,OOTDiffusion可以根据不同性别和体型自动调整服装,可控试穿参数,自然融合与逼真效果。
DeepFaceLive是一款基于人工智能的面部合成技术,它可以将一个人的面部表情和动作合成到另一个人的脸上,从而实现非常逼真的面部合成效果。
一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基础上,一次性生成多个场景的视频。
字节跳动发布的一种视频编辑工具,Boximator能让用户通过简单的操作控制生成视频中主体的运动轨迹。
StoryNest.ai 是一个将个性化的故事讲述与先进的AI技术相结合。凭借其互动功能,用户可以根据自己的喜好制作独特的故事,与 AI 角色进行实时对话,使故事栩栩如生。
Snackprompt.com是一个聚焦于AI prompts(即AI提示)的平台,能够提供给用户各种高质量的AI提示,让他们的ChatGPT体验更加卓越。
一个利用人工智能来组织团队工作的高效平台,用于高效存储和搜索会议记录和议程,协作项目管理,以及建立和维护知识库。
司马阅(SmartRead),是一款AI文档阅读分析工具,AI阅读神器,快速从复杂文档提取信息,与文档对话,提问即答案,效率翻百倍。
Monica是一款基于浏览器的Chrome扩展插件。它通过增强Chatgpt模型,提高您的工作效率,只需在任意网页上按下Cmd+M或Ctrl+M,即可与Chatgpt聊天。
一个允许用户通过人工智能创建和定制自己的漫画和插图的网站。
一个由人工智能驱动的可以通过文本自动生成漫画视频的平台,Manga TV彻底改变了漫画创作的过程。
Image Upscaler 是一款简单但功能强大的工具,它使用AI技术将较小的图像或分辨率较低的图像的大小提升到 4K 分辨率,也就是图像长尺寸的 4096 px。
这将关闭于 0 秒
FaceChain是一个可以用来打造个人数字形象的深度学习模型工具。用户仅需要提供最低一张照片即可获得独属于自己的个人形象数字替身。