AI 能力矩阵
星火大模型
AI 对话与问答
听写
实时语音识别
转写
音频文件转文字
合成
文字转语音
评测
语音评分
OCR 识别
图片文字提取
机器翻译
多语种互译
功能模块
编解码与音频工具
0
总调用次数
0
今日调用
0
活跃用户
0
活跃能力
调用趋势
能力分布
操作日志
| 用户 | 能力 | 操作 | SID | 状态 | 时间 |
|---|
星火认知大模型
开始对话,体验 AI 大模型的智能能力
大模型语音听写,支持热词、方言自动检测
支持多语种免切识别,勾选需要识别的语种(最多选3个)
中文普通话在线听写
上传同一段音频,对比有热词和无热词的识别效果差异
拖拽音频文件到这里
将分别用有热词和无热词两种模式识别上传音频文件或提供音频URL,获取转写结果
拖拽音频文件到这里
支持 mp3, wav, pcm 等格式🔄 替换词管理(非实时转写)
| 原词 | 替换为 | 操作 |
|---|---|---|
| 暂无替换词,点击"添加替换项" | ||
暂无替换列表
实时录音转写,支持角色分离
📝 会话级热词
逗号分隔,支持权重格式:词1,weight:5.0;词2。连接后自动发送,当次会话有效。
🔄 替换词管理(实时转写)
| 原词 | 替换为 | 操作 |
|---|---|---|
| 暂无替换词 | ||
批量上传多个音频文件(最多20个),并发转写并汇总结果,导出Excel
拖拽多个音频文件到这里
支持 mp3, wav, pcm 等格式,可多选上传同一个音频文件,同时用多种语言模式转写,对比识别效果
拖拽音频文件到这里
将同时用方言和多语种模式转写录音或上传音频注册声纹特征(10秒~1分钟),注册后可用于转写角色分离
已注册声纹
加载中...
超拟人语音合成,支持口语化表达
标准在线语音合成
输入文本,选择多个发音人,一键对比试听效果
合成技巧
静音停顿:在文本中插入
示例:
注意:文本中的标点符号、空格、回车均会产生静音停顿效果。
[p500] 可加入 500ms 静音。示例:
你好[p500]人工智能 — "你好" 后将停顿 500ms。注意:文本中的标点符号、空格、回车均会产生静音停顿效果。
指定汉字发音:使用
声调用数字 1~5 表示(阴平、阳平、上声、去声、轻声)。
示例:
[=拼音] 为前一个汉字指定读音。声调用数字 1~5 表示(阴平、阳平、上声、去声、轻声)。
示例:
着[=zhuo2]手 — "着" 将读作 "zhuó"。
标准语音评测,支持中英文朗读评分
Suntone 评测,支持中英日韩法德俄西
上传图片
拖拽图片到这里
或点击选择文件识别结果
机器翻译
查询授权信息、账户信息、用量统计
为应用添加时长(小时数)授权
设置应用的 QPS 或并发数限制
为应用添加语种授权许可
用户管理
| ID | 用户名 | 角色 | APP ID | 权限 | 注册时间 | 操作 |
|---|
邀请码管理
知识库问答
基于已上传文档的智能问答,输入问题获取精准回答
可视化签名过程,一键测试各能力鉴权连通性
签名生成调试
连通性测试
使用当前密钥,一键测试各能力的鉴权是否通过
输入讯飞 API 返回的错误码,查询含义和解决方案
常见错误码速查
对文本进行 Base64 编码或解码
解析并格式化 JSON 文本,支持树状展开
上传音频文件(wav/pcm/mp3/m4a),自动检测格式属性并显示各能力兼容性
拖拽音频文件到这里
支持 wav, pcm, mp3, m4a 等格式对比参考文本与识别结果,计算字错率(CER)并高亮差异