Talking Avatar
Vorschau erstellen
POST https://devapi.vidnoz.com/v2/task/preview
Anforderungsheader
| Parameter | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| Content-Type | true | string | Datenübertragung -Type: multipart/form-data |
Anforderungsattribute
1. Voreingestellte Stimme verwenden
| Parameter | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| voice_id | true | string | ID der Stimmeliste (voice_id wird bevorzugt) |
| text | true | string | Textinhalt |
2. Geklonte Stimme verwenden
| Parameter | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| lang | true | string | Sprache (Klonmodus unterstützt nur Englisch, Traditionelles Chinesisch, Koreanisch, Japanisch) |
| file | false | file | Hochgeladene Original-Audiodatei (dieses Feld hat Priorität). Es werden zwei Methoden zum Hochladen von Audiodateien unterstützt. |
| file_url | false | string | Adresse der Original-Audiodatei. Es werden zwei Methoden zum Hochladen von Audiodateien unterstützt. |
| text | true | string | Textinhalt |
Antwortattribute
| Parameter | Typ | Beschreibung |
|---|---|---|
| code | int | 200 |
| message | string | Aufgabenhinweis |
| data | obj | Aufgabenobjekt |
| data.task_id | string | Aufgaben-ID |
Beispiel
Anforderungsattribute
1. Voreingestellte Stimme verwenden
curl --request POST \
--url https://devapi.vidnoz.com/v2/task/preview \
--header "accept: application/json" \
--header "content-type: multipart/form-data" \
--header "Authorization: Bearer $API_KEY" \
--form 'voice_id="YmUxSTFBcVA1V1A3N2Y3L2hxMHhGQT09"' \
--form 'text="Input your text here"' \
2. Geklonte Stimme verwenden
curl --request POST \
--url https://devapi.vidnoz.com/v2/task/preview \
--header "accept: application/json" \
--header "content-type: multipart/form-data" \
--header "Authorization: Bearer $API_KEY" \
--form 'lang="en"' \
--form 'file="YmUxSTFBcVA1V1A3N2Y3L2hxMHhGQT09"' \
--form 'file_url="https://static-alter1.vidnoz.com/system/openapi/sample/audio-Cora.wav"' \
--form 'text="Input your text here"' \
Antwortattribute
{
"code": 200,
"message": "ok",
"data": {
"task_id": "T2hzVGJ5dWhaSUxSSUJqSzZORUdpUT09"
}
}
Anschließend können Sie den Aufgabenstatus abfragen und die Aufgabendaten über die task/detail -Schnittstelle abrufen.
Sprechendes Foto-Video erstellen
POST https://devapi.vidnoz.com/v2/task/generate-talking-head
Anforderungsheader
| Parameter | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| Content-Type | true | string | Datenübertragung -Type: multipart/form-data |
Anforderungsattribute
1. Audio mit voreingestellter Stimme synthetisieren
| Parameter | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| voice_id | true | string | ID der Stimmeliste (voice_id wird bevorzugt) |
| text | true | string | Textinhalt |
| type | true | int | 0:Voreingestellte Stimme |
| avatar | false | file | Hochgeladenes Original-Avatarbild (dieses Feld hat Priorität). Es werden zwei Methoden zum Hochladen von Avatarbildern unterstützt. Unterstütztes Format: JPG, PNG, JPEG, WebP |
| avatar_url | false | string | Hochgeladenes Original-Avatarbild. Es werden zwei Methoden zum Hochladen von Avatarbildern unterstützt. Unterstütztes Format: JPG, PNG, JPEG, WebP |
2. Audio mit geklonter Stimme synthetisieren
| Parameter | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| text | true | string | Textinhalt |
| style | false | string | Emotion standardmäßig neutral |
| lang | true | string | Textinhalt |
| avatar | false | file | Hochgeladenes Original-Avatarbild (dieses Feld hat Priorität). Es werden zwei Methoden zum Hochladen von Avatarbildern unterstützt. Unterstütztes Format: JPG, PNG, JPEG, WebP |
| avatar_url | false | string | Hochgeladenes Original-Avatarbild. Es werden zwei Methoden zum Hochladen von Avatarbildern unterstützt. Unterstütztes Format: JPG, PNG, JPEG, WebP |
| type | true | int | 1:Geklonte Stimme |
| file | false | file | Hochgeladene Original-Audiodatei (dieses Feld hat Priorität). Es werden zwei Methoden zum Hochladen von Audiodateien unterstützt. Unterstütztes Format: WAV, MP3, MP4, AAC, WebM Maximal 200 MB |
| file_url | false | string | Hochgeladene Original-Audiodatei. Es werden zwei Methoden zum Hochladen von Audiodateien unterstützt. Unterstütztes Format: WAV, MP3, MP4, AAC, WebM (Maximal 200 MB). |
3. Audiodateien direkt hochladen
| Parameter | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| avatar | false | file | Hochgeladenes Original-Avatarbild (dieses Feld hat Priorität). Es werden zwei Methoden zum Hochladen von Avatarbildern unterstützt. Unterstütztes Format: JPG, PNG, JPEG, WebP |
| avatar_url | false | string | Hochgeladenes Original-Avatarbild. Es werden zwei Methoden zum Hochladen von Avatarbildern unterstützt. Unterstütztes Format: JPG, PNG, JPEG, WebP |
| type | true | int | 2:Audio hochladen |
| file | false | file | Hochgeladene Original-Audiodatei (dieses Feld hat Priorität). Es werden zwei Methoden zum Hochladen von Audiodateien unterstützt. Unterstütztes Format: WAV, MP3, MP4, AAC, WebM Maximal 200 MB |
| file_url | false | string | Hochgeladene Original-Audiodatei. Es werden zwei Methoden zum Hochladen von Audiodateien unterstützt. Unterstütztes Format: WAV, MP3, MP4, AAC, WebM (Maximal 200 MB). |
Antwortattribute
| Parameter | Typ | Beschreibung |
|---|---|---|
| code | int | 200 |
| message | string | Aufgabenhinweis |
| data | obj | Aufgabenobjekt |
| data.task_id | string | Aufgaben-ID |
Beispiel
Anforderungsattribute
1. Audio mit voreingestellter Stimme synthetisieren
curl --request POST \
--url https://devapi.vidnoz.com/v2/task/generate-talking-head \
--header "accept: application/json" \
--header "content-type: multipart/form-data" \
--header "Authorization: Bearer $API_KEY" \
--form 'voice_id="YmUxSTFBcVA1V1A3N2Y3L2hxMHhGQT09"' \
--form 'text="Input your text here"' \
--form 'avatar="YmUxSTFBcVA1V1A3N2Y3L2hxMHhGQT09"' \
--form 'avatar_url="https://static-alter1.vidnoz.com/system/openapi/sample/talking-photo.jpg"' \
2. Audio mit geklonter Stimme synthetisieren
curl --request POST \
--url https://devapi.vidnoz.com/v2/task/generate-talking-head \
--header "accept: application/json" \
--header "content-type: multipart/form-data" \
--header "Authorization: Bearer $API_KEY" \
--form 'text="Input your text here"' \
--form 'lang="en"' \
--form 'avatar="YmUxSTFBcVA1V1A3N2Y3L2hxMHhGQT09"' \
--form 'avatar_url="https://static-alter1.vidnoz.com/system/openapi/sample/talking-photo.jpg"' \
--form 'type="Input your text here"' \
--form 'file="YmUxSTFBcVA1V1A3N2Y3L2hxMHhGQT09"' \
--form 'file_url="https://static-alter1.vidnoz.com/system/openapi/sample/audio-Cora.wav"' \
3. Audiodateien direkt hochladen
curl --request POST \
--url https://devapi.vidnoz.com/v2/task/generate-talking-head \
--header "accept: application/json" \
--header "content-type: multipart/form-data" \
--header "Authorization: Bearer $API_KEY" \
--form 'text="Input your text here"' \
--form 'lang="en"' \
--form 'avatar="YmUxSTFBcVA1V1A3N2Y3L2hxMHhGQT09"' \
--form 'avatar_url="https://static-alter1.vidnoz.com/system/openapi/sample/talking-photo.jpg"' \
--form 'type="YmUxSTFBcVA1V1A3N2Y3L2hxMHhGQT09"' \
--form 'file="YmUxSTFBcVA1V1A3N2Y3L2hxMHhGQT09"' \
--form 'file_url="https://static-alter1.vidnoz.com/system/openapi/sample/audio-Cora.wav"' \
Antwortattribute
{
"code": 200,
"message": "",
"data": {
"id": 200080893,
"message": "",
"status": 0,
"additional_data": {
"key": "1328/asset/202412/204867612a0e51e4b2.55156474.mp4",
"url": "",
"video_720p": {
"key": "1328/asset/202412/204867612a0e51e4b2.55156474.mp4",
"url": "",
"video_size": 1072200,
"video_duration": 13.6
},
"video_size": 1072200,
"video_duration": 13.6
},
"user_id": 1328
}
}
Anschließend können Sie den Aufgabenstatus abfragen und die Aufgabendaten über die task/detail -Schnittstelle abrufen.
Offizielle Stimmeliste abrufen
GET https://devapi.vidnoz.com/v2/voice/list
Antwortattribute
| Parameter | Typ | Beschreibung |
|---|---|---|
| voices | array | Liste der Stimmen. |
| voices.voice_id | string | Eindeutiger Bezeichner für die Stimme. |
| voices.name | string | Name der Stimme. |
| voices.country_name | string | Name des Landes. |
| voices.country_icon_url | string | URL für das Ländersymbol. |
| voices.preview_audio_url | string | URL für die Stimmvorschau. |
| voices.gender | string | Geschlecht der Stimme: männlich, weiblich, unbekannt. |
| voices.language | string | Sprache der Stimme. |
| voices.style_list | array | Liste der verfügbaren Emotionen. |
| voices.words_per_minute | string | Aufgaben-ID |
Beispiel
Antwortattribute
{
"code": 200,
"message": "ok",
"data": {
"voices": [
{
"voice_id": "M084TEhqTlFkdE8wRUxvRXFoVWlRdz09",
"name": "es-ES-Neural2-A",
"country_name": "Spanish(ES)",
"country_icon_url": "https://static-alter1.vidnoz.com/system/asset/202309/65040c1b9027e.png",
"preview_audio_url": "https://static-alter1.vidnoz.com/designer/asset/202407/9519669f4ae45e1639.54065252.mp3",
"gender": "female",
"language": "es",
"style_list": [
"normal",
"cheerful",
"chat"
]
"words_per_minute": null
},
{
"voice_id": "Rm5wL2NLWjY4SGlqSVFMLzF5WXFJUT09",
"name": "Celeste",
"country_name": "French(FR)",
"country_icon_url": "https://static-alter1.vidnoz.com/system/asset/202308/64d9fcf847f1c.png",
"preview_audio_url": "https://static-alter1.vidnoz.com/designer/asset/202312/9469658d2b7f223131.32142677.wav",
"gender": "female",
"language": "fr",
"style_list": [
"normal"
],
"words_per_minute": "155"
}
]
}
}
Aufgabendetails abrufen
POST https://devapi.vidnoz.com/v2/task/detail
Anforderungsattribute
| Parameter | Erforderlich | Typ | Beschreibung |
|---|---|---|---|
| id | true | string | Aufgaben-ID |
Antwortattribute
| Parameter | Typ | Beschreibung |
|---|---|---|
| id | int | Aufgaben-ID |
| message | int | Informationen zur Aufgabe. |
| status | int | Der aktuelle Status der Aufgabe -1: nicht ausgeführt; -2: in Ausführung. |
| additional_data | json | Generierungsergebnisse; Details siehe unten. |
Beispiel
Anforderungsattribute
curl --request POST \
--url https://devapi.vidnoz.com/v2/task/detail \
--header "accept: application/json" \
--header "content-type: multipart/form-data" \
--header "Authorization: Bearer $API_KEY" \
--form 'id="YmUxSTFBcVA1V1A3N2Y3L2hxMHhGQT09"' \
Antwortattribute
{
"code": 200,
"message": "ok",
"data": {
"id": 106927142,
"message": "",
"status": 0,
"additional_data": {}
}
}
1.ai_headshot
Antwortattribute
| Parameter | Typ | Beschreibung |
|---|---|---|
| img_key | string | Schlüssel der generierten Datei |
| img_url | string | URL der generierten Datei. |
Beispiel
{
"additional_data": [
{
"img_key": "temporary/20241217/1328/1734417109904-a9c51522-05d1-afbf-20ab-a2b14489075c.png",
"img_url": ""
},
{
"img_key": "temporary/20241217/1328/1734417112762-1ed846fb-5984-b695-a32b-454e74034a5a.png",
"img_url": ""
}
]
}
}
2.Vorschau des sprechenden Fotos
Antwortattribute
| Parameter | Typ | Beschreibung |
|---|---|---|
| key | int | Größe des generierten Videos. |
| url | float | Länge des generierten Videos. |
| subtitles | bool | Mit Untertiteln oder ohne |
| audio_size | string | Größe des generierten Audios. |
| audio_duration | float | Dauer des generierten Audios. |
Beispiel
{
"additional_data": {
"key": "1328/asset/202412/778367614047027e53.54679129.wav",
"url": "",
"subtitles": null,
"audio_size": 1177662,
"audio_duration": 13.351519
}
}
}
3.Videos generieren
Antwortattribute
| Parameter | Typ | Beschreibung |
|---|---|---|
| key | string | Schlüssel des generierten Videos. |
| url | string | URL des generierten Videos. |
| video_720p | obj | Generierte 720p-Videoinformationen oder null, wenn kein Video dieser Auflösung vorhanden ist. |
| video_720p.key | string | Schlüssel für generierte 720p-Videoinformationen. |
| video_720p.url | string | URL für generierte 720p-Videoinformationen. |
| video_720p.video_size | int | Größe der generierten 720p-Videoinformationen. |
| video_720p.video_duration | float | Dauer der generierten 720p-Videoinformationen. |
| video_size | int | Größe der generierten Videoinformationen. |
| video_duration | float | Dauer der generierten Videoinformationen. |
Beispiel
{
"additional_data":{
"key": "1328/asset/202412/945567613c44999c14.58089446.mp4",
"url": "",
"video_720p": {
"key": "1328/asset/202412/945567613c44999c14.58089446.mp4",
"url": "",
"video_size": 1146957,
"video_duration": 15.84
},
"video_size": 1146957,
"video_duration": 15.84
}
}
4.text to image
Antwortattribute
| Parameter | Typ | Beschreibung |
|---|---|---|
| images | array | Array der generierten Bilder. |
| image_key | string | Schlüssel des generierten Bildes. |
| image_url | string | URL des generierten Bildes. |
| image_size | int | Größe des generierten Bildes. |
Beispiel
{
"additional_data":{
"images": [
{
"image_key": "2828/asset/202412/200081156_image_0.jpg",
"image_url": "",
"image_size": 26724
},
{
"image_key": "2828/asset/202412/200081156_image_1.jpg",
"image_url": "",
"image_size": 26724
},
{
"image_key": "2828/asset/202412/200081156_image_2.jpg",
"image_url": "",
"image_size": 26831
},
{
"image_key": "2828/asset/202412/200081156_image_3.jpg",
"image_url": "",
"image_size": 26831
}
]
}
}