个人作品集

AI 能力矩阵

星火大模型

AI 对话与问答

听写

实时语音识别

转写

音频文件转文字

合成

文字转语音

评测

语音评分

OCR 识别

图片文字提取

机器翻译

多语种互译

功能模块

编解码与音频工具

总调用次数

今日调用

活跃用户

活跃能力

调用趋势

能力分布

操作日志

用户	能力	操作	SID	状态	时间

模型

场景模板

星火认知大模型

开始对话，体验 AI 大模型的智能能力

大模型语音听写，支持热词、方言自动检测

热词（逗号分隔）

点击开始录音

支持多语种免切识别，勾选需要识别的语种（最多选3个）

识别语种

中文英文日语韩语俄语法语西班牙语阿拉伯语

点击开始录音

中文普通话在线听写

点击开始录音

上传同一段音频，对比有热词和无热词的识别效果差异

热词（逗号分隔）

拖拽音频文件到这里

将分别用有热词和无热词两种模式识别

上传音频文件或提供音频URL，获取转写结果

语言模式

启用发音人分离

分离人数（0=自动）

声纹选择

拖拽音频文件到这里

支持 mp3, wav, pcm 等格式

🔄 替换词管理（非实时转写）

类型

原词	替换为	操作
暂无替换词，点击"添加替换项"

已创建的替换列表

暂无替换列表

实时录音转写，支持角色分离

语言模式

启用角色分离

点击开始录音

📝 会话级热词

逗号分隔，支持权重格式：词1,weight:5.0;词2。连接后自动发送，当次会话有效。

🔄 替换词管理（实时转写）

原词	替换为	操作
暂无替换词

批量上传多个音频文件（最多20个），并发转写并汇总结果，导出Excel

语言模式

启用发音人分离

拖拽多个音频文件到这里

支持 mp3, wav, pcm 等格式，可多选

上传同一个音频文件，同时用多种语言模式转写，对比识别效果

拖拽音频文件到这里

将同时用方言和多语种模式转写

录音或上传音频注册声纹特征（10秒~1分钟），注册后可用于转写角色分离

已注册声纹

加载中...

录音注册声纹（10秒~1分钟）

标准语音评测，支持中英文朗读评分

评测类型

语种

点击开始录音

Suntone 评测，支持中英日韩法德俄西

语种

评测维度

点击开始录音

上传图片

拖拽图片到这里

或点击选择文件

识别结果

机器翻译

App ID

Access Key ID

Access Key Secret

目标 App ID

Channel

Account

查询授权信息、账户信息、用量统计

Function

开始日期

结束日期

为应用添加时长（小时数）授权

时长

有效天数

包含 all

额外语种

设置应用的 QPS 或并发数限制

数值

类型

范围

语种

为应用添加语种授权许可

语种

有效天数

用户管理

ID	用户名	角色	APP ID	权限	注册时间	操作

邀请码管理

知识库问答

基于已上传文档的智能问答，输入问题获取精准回答

可视化签名过程，一键测试各能力鉴权连通性

签名生成调试

鉴权方式

API Key / Access Key ID

API Secret / Access Key Secret

目标 URL

连通性测试

使用当前密钥，一键测试各能力的鉴权是否通过

输入讯飞 API 返回的错误码，查询含义和解决方案

常见错误码速查

对文本进行 Base64 编码或解码

编码解码

解析并格式化 JSON 文本，支持树状展开

上传音频文件（wav/pcm/mp3/m4a），自动检测格式属性并显示各能力兼容性

拖拽音频文件到这里

支持 wav, pcm, mp3, m4a 等格式

采样率

声道

输出格式

对比参考文本与识别结果，计算字错率（CER）并高亮差异

参考文本（正确答案）

识别结果

AI 能力矩阵

调用趋势

能力分布

操作日志

星火认知大模型

已注册声纹

上传图片

识别结果

机器翻译

用户管理

邀请码管理

知识库问答

签名生成调试

连通性测试

常见错误码速查

API 配置管理

请求日志

历史记录

修改密码