
发音评分用于评估 单个音素的准确性,以及它们在单词和句子中的发音质量。
我们提供 全面的发音评测,涵盖多个层级的评分,包括:
我们的 深度神经网络模型 基于 数千小时的母语者标准音频 进行训练。系统采用 10 毫秒帧分析 用户音频,提取 语音时长信息,并计算每个音素的 声学相似度评分。
评分计算方式如下:
这种自下而上的精准分析确保了高效、准确的口语评测体验。
该标准适用于发音、流利度、完整度及整体评分,教育产品可根据目标学习者调整阈值以优化训练效果。
我们的API提供 5 种题型,覆盖全场景语言训练:
不同类型的 API 对音频长度和推荐文本长度有不同要求:
API | 最大音频长度 | 推荐文本长度 |
---|---|---|
单词级别 | 20 秒 | 单个单词或字符 |
句子级别 | 90 秒 | 200 词以内 |
段落级别 | 180 秒 | 200 词以上 |
雅思口语评测 | 120 秒 | 无推荐限制 |
自由对话评测 | 290 秒 | 无推荐限制 |
声通发音和口语评测 API 兼容多种常见音频格式,以确保广泛适配性。支持的格式包括:
建议使用高质量音频格式,以获得更精准的评测结果。
为了确保最佳的评测准确性和文件大小,建议使用以下音频参数:
音频属性 | 推荐设置 |
---|---|
采样位深 | 16-bit |
采样率 | 16000 Hz |
声道 | 1(单声道) |
比特率 | ≥ 96 kbps |
采用以上推荐设置可以有效优化音频文件的大小,同时提升评测系统的表现。
苏州声通信息科技有限公司
地址: 苏州工业园区裕新路188号B1002
电话: 0512-66356882