aliyun-qwen-omni

Name: aliyun-qwen-omni
Author: cinience/alicloud-skills

$npx mdskill add cinience/alicloud-skills/aliyun-qwen-omni

Enables multimodal AI interactions using Alibaba Cloud Qwen Omni models

Solves tasks requiring combined image, audio, and text understanding
Uses Alibaba Cloud Model Studio Qwen Omni APIs for processing
Selects appropriate model based on input type and response needs
Returns results as text, audio, or combined modalities in real-time

SKILL.md

.github/skills/aliyun-qwen-omniView on GitHub ↗

---
name: aliyun-qwen-omni
description: Use when tasks require all-in-one multimodal understanding or generation with Alibaba Cloud Model Studio Qwen Omni models, including image-plus-audio interaction, voice assistants, and realtime multimodal agents.
version: 1.0.0
---

Category: provider

# Model Studio Qwen Omni

## Validation

```bash
mkdir -p output/aliyun-qwen-omni
python -m py_compile skills/ai/multimodal/aliyun-qwen-omni/scripts/prepare_omni_request.py && echo "py_compile_ok" > output/aliyun-qwen-omni/validate.txt
```

Pass criteria: command exits 0 and `output/aliyun-qwen-omni/validate.txt` is generated.

## Critical model names

Use one of these exact model strings:
- `qwen3-omni-flash`
- `qwen3-omni-flash-realtime`
- `qwen-omni-turbo`
- `qwen-omni-turbo-realtime`

## Typical use

- Image + audio + text assistant
- Realtime multimodal agents
- Spoken responses grounded in visual input

## Normalized interface (omni.chat)

### Request
- `model` (string, optional): default `qwen3-omni-flash`
- `text` (string, optional)
- `image` (string, optional)
- `audio` (string, optional)
- `response_modalities` (array<string>, optional): e.g. `["text"]`, `["text","audio"]`

### Response
- `text` (string, optional)
- `audio_url` or `audio_chunk` (optional)
- `usage` (object, optional)

## Quick start

```bash
python skills/ai/multimodal/aliyun-qwen-omni/scripts/prepare_omni_request.py \
  --output output/aliyun-qwen-omni/request.json
```

## References

- `references/sources.md`

More from cinience/alicloud-skills

Skill	Description
aliyun-adb-mysql	Use when managing Alibaba Cloud AnalyticDB for MySQL (ADB) via OpenAPI/SDK, including the user needs AnalyticDB resource lifecycle and configuration operations, status checks, or troubleshooting ADB API and cluster workflow issues.
aliyun-adb-mysql-test	Smoke test for aliyun-adb-mysql. Validate minimal authentication, API reachability, and one read-only query path.
aliyun-aicontent-generate	Use when managing Alibaba Cloud AIContent (AiContent) via OpenAPI/SDK, including the user needs AI content generation or content workflow operations in Alibaba Cloud, including listing assets, creating/updating generation configurations, checking task status, or troubleshooting failed content jobs.
aliyun-aicontent-generate-test	Smoke test for aliyun-aicontent-generate. Validate minimal authentication, API reachability, and one read-only query path.
aliyun-aimiaobi-generate	Use when managing Alibaba Cloud Quan Miao (AiMiaoBi) via OpenAPI/SDK, including the user asks for Alibaba Cloud MiaoBi content operations, including listing resources, creating/updating configurations, querying runtime status, and diagnosing API or workflow failures.
aliyun-aimiaobi-generate-test	Smoke test for aliyun-aimiaobi-generate. Validate minimal authentication, API reachability, and one read-only query path.
aliyun-airec-manage	Use when managing Alibaba Cloud AIRec (Airec) via OpenAPI/SDK, including the user needs recommendation-engine resource operations in Alibaba Cloud, including list/create/update flows, status inspection, and troubleshooting AIRec configuration or runtime issues.
aliyun-airec-manage-test	Smoke test for aliyun-airec-manage. Validate minimal authentication, API reachability, and one read-only query path.
aliyun-alb-manage	Use when managing and troubleshoot Alibaba Cloud ALB (Application Load Balancer), including the user asks to inspect, create, change, or debug ALB instances, listeners, server groups, rules, certificates, ACLs, security policies, or health checks in Alibaba Cloud.
aliyun-alb-manage-test	Smoke test for Alibaba Cloud ALB skill. Validates SDK auth, script compilation, list instances, and health check flows.