aliyun-qwen-asr-realtime

Name: aliyun-qwen-asr-realtime
Author: cinience/alicloud-skills

$npx mdskill add cinience/alicloud-skills/aliyun-qwen-asr-realtime

Enables low-latency real-time speech recognition using Alibaba Cloud Qwen ASR Realtime models

Solves the need for real-time transcription of streaming audio input
Leverages Alibaba Cloud Model Studio Qwen ASR Realtime APIs for processing
Uses model-specific parameters like language hints and audio format for accurate recognition
Delivers continuous speech-to-text results via WebSocket or streaming sessions

SKILL.md

.github/skills/aliyun-qwen-asr-realtimeView on GitHub ↗

---
name: aliyun-qwen-asr-realtime
description: Use when low-latency realtime speech recognition is needed with Alibaba Cloud Model Studio Qwen ASR Realtime models, including streaming microphone input, live captions, or duplex voice agents.
version: 1.0.0
---

Category: provider

# Model Studio Qwen ASR Realtime

## Validation

```bash
mkdir -p output/aliyun-qwen-asr-realtime
python -m py_compile skills/ai/audio/aliyun-qwen-asr-realtime/scripts/prepare_realtime_asr_request.py && echo "py_compile_ok" > output/aliyun-qwen-asr-realtime/validate.txt
```

Pass criteria: command exits 0 and `output/aliyun-qwen-asr-realtime/validate.txt` is generated.

## Output And Evidence

- Save session payloads and response samples under `output/aliyun-qwen-asr-realtime/`.

## Critical model names

Use one of these exact model strings:
- `qwen3-asr-flash-realtime`
- `qwen3-asr-flash-realtime-2026-02-10`

## Use cases

- Realtime subtitles and captions
- Voice-agent duplex input
- Streaming speech-to-text in browser or terminal clients

## Prerequisites

- Set `DASHSCOPE_API_KEY` in your environment, or add `dashscope_api_key` to `~/.alibabacloud/credentials`.
- Realtime sessions generally require WebSocket or streaming session handling in the client.

## Normalized interface (asr.realtime)

### Request
- `model` (string, optional): default `qwen3-asr-flash-realtime`
- `language_hints` (array<string>, optional)
- `format` (string, optional): e.g. `pcm`, `wav`
- `sample_rate` (int, optional): e.g. `16000`
- `chunk_ms` (int, optional): frame size in milliseconds

### Response
- `text` (string): recognized transcript fragment
- `is_final` (bool): finalization marker
- `usage` (object, optional)

## Quick start

Generate a request template:

```bash
python skills/ai/audio/aliyun-qwen-asr-realtime/scripts/prepare_realtime_asr_request.py \
  --output output/aliyun-qwen-asr-realtime/request.json
```

## Operational guidance

- Prefer 16kHz mono PCM unless your client stack requires another format.
- Keep chunks small enough for responsive partial results.
- If you only have recorded files, use `skills/ai/audio/aliyun-qwen-asr/` instead.

## References

- `references/sources.md`

More from cinience/alicloud-skills

Skill	Description
aliyun-adb-mysql	Use when managing Alibaba Cloud AnalyticDB for MySQL (ADB) via OpenAPI/SDK, including the user needs AnalyticDB resource lifecycle and configuration operations, status checks, or troubleshooting ADB API and cluster workflow issues.
aliyun-adb-mysql-test	Smoke test for aliyun-adb-mysql. Validate minimal authentication, API reachability, and one read-only query path.
aliyun-aicontent-generate	Use when managing Alibaba Cloud AIContent (AiContent) via OpenAPI/SDK, including the user needs AI content generation or content workflow operations in Alibaba Cloud, including listing assets, creating/updating generation configurations, checking task status, or troubleshooting failed content jobs.
aliyun-aicontent-generate-test	Smoke test for aliyun-aicontent-generate. Validate minimal authentication, API reachability, and one read-only query path.
aliyun-aimiaobi-generate	Use when managing Alibaba Cloud Quan Miao (AiMiaoBi) via OpenAPI/SDK, including the user asks for Alibaba Cloud MiaoBi content operations, including listing resources, creating/updating configurations, querying runtime status, and diagnosing API or workflow failures.
aliyun-aimiaobi-generate-test	Smoke test for aliyun-aimiaobi-generate. Validate minimal authentication, API reachability, and one read-only query path.
aliyun-airec-manage	Use when managing Alibaba Cloud AIRec (Airec) via OpenAPI/SDK, including the user needs recommendation-engine resource operations in Alibaba Cloud, including list/create/update flows, status inspection, and troubleshooting AIRec configuration or runtime issues.
aliyun-airec-manage-test	Smoke test for aliyun-airec-manage. Validate minimal authentication, API reachability, and one read-only query path.
aliyun-alb-manage	Use when managing and troubleshoot Alibaba Cloud ALB (Application Load Balancer), including the user asks to inspect, create, change, or debug ALB instances, listeners, server groups, rules, certificates, ACLs, security policies, or health checks in Alibaba Cloud.
aliyun-alb-manage-test	Smoke test for Alibaba Cloud ALB skill. Validates SDK auth, script compilation, list instances, and health check flows.