AI 能力矩阵

星火大模型
AI 对话与问答
听写
实时语音识别
转写
音频文件转文字
合成
文字转语音
评测
语音评分
OCR 识别
图片文字提取
机器翻译
多语种互译
功能模块
编解码与音频工具
0
总调用次数
0
今日调用
0
活跃用户
>
0
活跃能力

调用趋势

能力分布

操作日志

用户能力操作SID状态时间

星火认知大模型

开始对话,体验 AI 大模型的智能能力

大模型语音听写,支持热词、方言自动检测

点击开始录音

支持多语种免切识别,勾选需要识别的语种(最多选3个)

点击开始录音

中文普通话在线听写

点击开始录音

上传同一段音频,对比有热词和无热词的识别效果差异

拖拽音频文件到这里

将分别用有热词和无热词两种模式识别

上传音频文件或提供音频URL,获取转写结果

拖拽音频文件到这里

支持 mp3, wav, pcm 等格式
🔄 替换词管理(非实时转写)
原词 替换为 操作
暂无替换词,点击"添加替换项"
暂无替换列表

实时录音转写,支持角色分离

点击开始录音
📝 会话级热词

逗号分隔,支持权重格式:词1,weight:5.0;词2。连接后自动发送,当次会话有效。

🔄 替换词管理(实时转写)
原词替换为操作
暂无替换词

批量上传多个音频文件(最多20个),并发转写并汇总结果,导出Excel

拖拽多个音频文件到这里

支持 mp3, wav, pcm 等格式,可多选

上传同一个音频文件,同时用多种语言模式转写,对比识别效果

拖拽音频文件到这里

将同时用方言和多语种模式转写

录音或上传音频注册声纹特征(10秒~1分钟),注册后可用于转写角色分离

已注册声纹

加载中...
录音注册声纹(10秒~1分钟)

超拟人语音合成,支持口语化表达

标准在线语音合成

输入文本,选择多个发音人,一键对比试听效果

合成技巧
静音停顿:在文本中插入 [p500] 可加入 500ms 静音。
示例:你好[p500]人工智能 — "你好" 后将停顿 500ms。
注意:文本中的标点符号、空格、回车均会产生静音停顿效果。
指定汉字发音:使用 [=拼音] 为前一个汉字指定读音。
声调用数字 1~5 表示(阴平、阳平、上声、去声、轻声)。
示例:着[=zhuo2]手 — "着" 将读作 "zhuó"。

标准语音评测,支持中英文朗读评分

点击开始录音

Suntone 评测,支持中英日韩法德俄西

点击开始录音

上传图片

拖拽图片到这里

或点击选择文件

识别结果

机器翻译

查询授权信息、账户信息、用量统计

为应用添加时长(小时数)授权

设置应用的 QPS 或并发数限制

为应用添加语种授权许可

用户管理

ID 用户名 角色 APP ID 权限 注册时间 操作

邀请码管理

知识库问答

基于已上传文档的智能问答,输入问题获取精准回答

可视化签名过程,一键测试各能力鉴权连通性

签名生成调试


连通性测试

使用当前密钥,一键测试各能力的鉴权是否通过

输入讯飞 API 返回的错误码,查询含义和解决方案

常见错误码速查

对文本进行 Base64 编码或解码

解析并格式化 JSON 文本,支持树状展开

上传音频文件(wav/pcm/mp3/m4a),自动检测格式属性并显示各能力兼容性

拖拽音频文件到这里

支持 wav, pcm, mp3, m4a 等格式

对比参考文本与识别结果,计算字错率(CER)并高亮差异