
Whisper语音识别 - OpenAI
Whisper是一个由OpenAI训练并开源的神经网络,它在英语语音识别上接近人类的鲁棒性和准确性。它是一个自动语音识别(ASR)系统,通过从网络收集的680,000小时的多语言和多任务监督数据进行训练。Whisper能够改善对口音、背景噪音和技术语言的鲁棒性,并且能够进行多种语言的转录以及将这些语言翻译成英语。

多语言识别 - 读光
覆盖了几大语系,十余个国家的语言检测识别。适用于国际化所需的各类图文识别与信息翻译。通用多语言识别模型可自动对语言模型进行分类检测,更加通用灵活。专用语言模型提供特定语言识别模型,精准度更高。

AI生成音频语音 - koolio
一个支持AI的基于Web的协作播客创建平台,致力于简化播客创作流程。用户可以在这里转录音频、自动选择音效或音乐,并轻松执行音频编辑操作。从概念到成品,只需几秒钟即可完成,非常适合各类创作者和播客爱好者。

AI生成音频语音 - MurfAI
在线AI文字转语音合成配音工具,拥有丰富的语音库和额外功能,如语音克隆和变换。用户可轻松将文本转换为自然逼真的语音,支持多种语言和口音选择,适用于视频、广告、播客等多种场景,帮助用户快速创建高质量的配音内容。

阿里AI音频语音工具 - 通义听悟
通义听悟是阿里云推出的一款工作学习AI助手,专注于音视频内容的处理。为用户提供了一个全新的音视频体验,帮助用户在会议、学习、访谈、培训等多种场景下提高效率和信息处理能力。

公式识别 - 读光
公式识别是教育的基础OCR识别能力,可支持理科(数学、物理、化学、生物等)的印刷体和手写体的公式识别,其中,印刷体公式识别率高于96%,返回结果为Latex格式。适用于题目录入、智能批改、作业批改等应用场景。
找工具、问问题、搜资源
1.找工具或者问问题,直接提问搜索即可。
2.输入关键词+资源名称快速找资源,例如:
#搜索美女的图片,输入"美女图片"
#搜索文档,输入"合同文档"或"合同pdf"
#搜索蜘蛛侠影视等,输入"蜘蛛侠在线看"
#搜索cad软件下载,输入"cad下载"
目前提供大量的资源类型,包括:
图标、规范、图集、百科、翻译、在线看、组词、图片、壁纸、音乐、小说、文档、下载、漫画、视频、png、插画、电子书等等,更多资源工具正在制作中...

微信扫一扫
微信关注“搜索兔”获取最新资讯和福利