语音识别

活动说明

将音频转换为文字输出，最长 60s。支持格式：pcm 、speex（8k）、speex-wb（16k）、mp3。使用该活动需要联网并确认额度充足

执行逻辑：将上传的音频经过系统处理后转换成文字输出到指定的变量中

属性说明

输入项

音频文件路径

字符串

输入需要识别的音频文件路径

语言

[下拉选项]

选择音频文件识别语言，中文或英文

音频格式

[下拉选项]

从下拉框中选择音频的格式，支持pcm、mp3、speex（8k）、speex-wb（16k）

应用领域

[下拉选项]

选择识别的音频在日常应用中属于的领域，有助于语音识别率

输出项

输入需要接收语音识别结果的变量，提供两种输入方式，可二选一：

结构化字符串

字符串

输入变量，用于接收语音识别结果

json字符串

字符串

输入变量后，接收的语音识别结果会以json结构展示

使用示例

属性栏设置：

运行结果：

注意事项

语音识别的成功率与音频文件的清晰程度有关，越清晰识别度越高

results matching ""