使用教程

详细的使用指南,助您快速上手AI数字人直播系统

01

系统设置与安装

虚拟声卡设置

配置虚拟声卡以实现更好的音频输出效果,支持多路音频混流。

打开控制面板-点击硬件和声音-管理音频设备-选择扬声器

在"播放"栏里设"CABLE Input"为默认设备

CABLE Input设置

在"录制"栏里将"CABLE Output"设为默认播放设备

CABLE Output设置

直播伴侣音频设置

打开直播设置-点击音频

直播设置-点击音频

麦克风选择设置选项为"CABLE Output(VB-Audio Virtual)"

扬声器选择设置选项为"CABLE Input(VB-Audio Virtual)"

数字人开播后可以看到输入音量表有波动,如果输入音量表未有波动,请检查各项设置,并重新启动数字人直播。

视频号的音频设置

视频号的音频输入选择"CABLE Output(VB-Audio Virtual)"

视频号的扬声器选项一定要选择静音

视频号扬声器设置

快手的音频设置

打开直播设置-点击声音

麦克风选择"CABLE Output(VB-Audio Virtual Cable)"

快手的扬声器选项一定要选择静音

快手扬声器设置

系统安装文档

电脑准备

安装软件:抖音直播伴侣,360压缩,chrome浏览器,百度网盘,todesk

系统配置:台式电脑,Windows操作系统,无具体配置要求。可以租用云电脑

软件下载

网站首页点击软件下载获取百度网盘最新系统下载链接,进行下载。推荐开百度网盘会员,方便后续第一时间升级系统

软件下载

软件解压

右键正常进行解压即可,这里不要解压到中文路径了,也不要点到解压到当前文件夹,即图中箭头指出的选项

软件解压

插件安装

进入系统,点击一键安装插件.exe,对虚拟摄像头,虚拟麦克风,逐个点击安装。全部安装一遍后,关闭一键安装插件.exe再次打开,确认所有文本都显示绿色。

插件安装

点击后请耐心等待安装,不要乱动⚠️⚠️⚠️

安装麦克风

安装虚拟摄像头,点击即可。

关闭防火墙,点击即可。

安装.net插件,点击按流程安装即可。

安装webview插件,点击按流程安装即可。

最后再次打开一次软件,看文本是不是都变成了绿色。

最后验证

启动软件

启动软件,看到登录页面正确出现就算安装完成。

启动软件

虚拟内存设置

配置系统虚拟内存以确保软件运行流畅,特别是在使用数字人直播时。

设置步骤

先找到此电脑右键此电脑找到属性,点击属性,会弹出系统页面。

打开搜索功能

找到高级系统设置,点击高级系统设置,然后会弹出一个系统属性新页面。

查看高级系统设置

在弹出的系统属性里面,点击高级->第一个设置按钮->点高级->点击虚拟内存区域的更改按钮,然后给每一个盘都选择自定义大小,两个框都输入16000,点击确定,最后重启电脑即可。

打开系统属性
02

开播必学

快速开播教程

从零开始,5分钟内完成首次开播配置。

需要准备(以视频号为例)

1 一直播账号(需有一定会员时长和算力时长)
2 粉丝>200 的视频号(可提前刷粉)
3 带货权限开通
4 数字人plus权限(可选)开通才能使用数字人直播功能

启动数字人模块

数字人文件

检查更新,将一直播系统更新到最新版本

检查更新

一键安装插件,从上到下依次点击,出现如下图显示的绿色即是全部插件安装完成

插件安装

双击启动"一直播"应用程序

启动应用

账号注册与登录

点击注册,使用邮箱注册账号,按照流程设置用户名密码,并正确接收填写验证码。新注册账号后可通过卡密进行充值

注册账号

输入刚刚注册好的账号密码,点击"登录",登录一直播系统

登录系统

启动后将管理员给的算力卡密和会员天数的卡密充值在个人账户里

充值卡密

设置大模型

在我的--大模型配置中输入对应的大模型api key

设置大模型

目前支持的厂商有火山智谱硅基流动,配置可参考第三方平台注册

声音克隆

(1)云端克隆

点击下方声音克隆,进入声音管理页面。点击右上角克隆声音按钮。选择录制好的声音,输入声音名称,选择是否使用Minmax云端克隆(注意,使用Minmax云端克隆要额外配置专用apikey,可以不用开启)。手机录音机录制即可,录制期间不要有其他杂音,主播说话要听的清楚,吐词清晰,语速最好平播不要太快,中途可以休息几秒不说话,说错话不要紧正常录制。音频长度10到20秒即可,绝对不能搞的太长否则可能造成语音合成失败!

云端克隆

点击开始克隆,耐心等待克隆完成,克隆过程中不要关闭软件!!!!

开始克隆

(2)本地克隆

点击下方声音克隆,进入声音管理页面。点击右上角克隆声音按钮。选择录制好的声音,输入声音名称,选择本地克隆(超拟真)【本地克隆不消耗自己的算力,克隆不会扣除自己账户里的算力,但是声音更真实,耗时也较久,需要耐心等待】

本地克隆

点击开始克隆,耐心等待克隆完成,克隆过程中不要关闭软件!!!!

开始克隆

形象克隆

下方菜单栏新增 形象克隆,点击后进入形象管理页面。点击克隆形象,上传对应视频,输入模特名称,点击开始克隆,等待克隆完成即可。

形象克隆

V1 形象 对性能要求相对较低,但对素材要求比较高,不推荐使用

V2 形象(推荐)对性能有一定要求,显卡大于1660s即可使用,详情可见显卡天梯图

显卡天梯图

数字人模特录制要求请参考 形象克隆录制教程

直播间创建

克隆完声音后创建直播间,点击右上角创建直播间,然后点击进入直播间(可以创建其他平台直播间,这里仅以抖音为例)

创建直播间

开启数字人直播

创建一个 直播类型为 数字人直播的直播间,并点击进入直播间,并按照以下顺序进行直播间设置

模特配置页面

选择好使用hjzn_audio声音,选择好音色,选择好数字人模特,选择好画面输出方式即可,其他默认即可。画面选择虚拟摄像头输出可以提升清晰度,在伴侣里面选择名为c920的摄像头即可看到画面。

注意:使用虚拟摄像头输出必须正确点击一键安装插件内的安装虚拟摄像头按钮。如果因系统环境变化而导致虚拟摄像头找不到,修复方法参考:1 下载obs 2 关掉我们的软件 3 在obs里面点击启动虚拟摄像头,然后关闭obs 4 在一键安装插件里面再点击安装摄像头 5 重启电脑

虚拟摄像头设置

智能话术页面

AI会根据商品信息来生成话术和与直播间弹幕和观众进行互动。商品信息必须写的清晰足够详细,绝对不能不写!写清楚商品信息后点击AI生成话术,自己审查一遍话术的效果。

智能话术

以下是更详细的商品信息模板 👇👇👇👇

商品类型:林阿荣无盐茯苓薏米山药线面 福建特产 龙须面 挂面
价格:十五块九买5袋线面再送5袋线面
●二十二块九买10袋线面再送10袋线面
● 五十二块九买20袋线面再送20袋线面
● 二十二块九还能选择买10袋线面送10包红烧牛肉调味包
适用人群:男女老少都可以食用
优势:控糖减脂的 某糖某高的 老人家小朋友小宝宝跟哺乳期妈妈都可以吃
产品优势:成分是茯苓薏米山药小麦粉加水啊 茯苓薏米上的成分呢 占比含量做到了40%以上 纯纯的谷物杂粮 没有任何的额外添加 像大家问的很多的什么硼砂 明胶食用胶都没有放啊 盐巴也没有放含钠量是为0的 真正的0钠0添加 可以当主食辅食 当代餐 1分钟不到就可以煮好
售后保障:
●极速退款
●7天无理由退换
●48小时内发货,晚发即赔
快递:默认极兔快递,需要圆通或邮政发货的请联系客服备注哦,48小时内在福建发货

外套商品信息模板案例二 👇👇👇👇

商品类型:加绒加厚一体绒外套
价格:39.9元
适用人群:男女通用,适合17-80岁年龄段
适用身高:145-175cm都可穿着
衣长:66-69cm(每码数增加1cm)
尺码建议:正常码数正常选择,偏瘦/卡码建议选大一码
重量参考:130斤选4XL,95斤选2XL
保暖性能:
● 一体绒材质,不掉毛不跑毛
● 前胸、后背、袖子都有加绒
● 保暖称3秒发热,5秒恒温锁温
● 防风保暖效果好
售后保障:
● 提供运费险
● 7天无理由退换
● 支持多件试穿后选择保留
款式颜色:
● 提供多色可选:米白色、皮粉色、红色、紫色、绿色、蓝色等
● 建议年长者选择红色、紫色等喜庆色系
● 风格休闲百搭

互动配置页面

智能互动分为三个板块,互动配置,关键词问答,互动间隔配置

互动配置

互动配置页面主要 输入直播间分享链接,其他配置在快速开播流程中不建议修改,使用默认设置即可。

如果是视频号直播,点击后扫码登陆即可

视频号直播间链接格式:https://live.douyin.com/881086335519(这里是你自己的直播间地址,浏览器打开直播间网页后复制链接进去)

快手直播间链接格式:https://live.kuaishou.com/u/shc77077(这里是你自己的直播间地址,浏览器打开直播间网页后复制链接进去)

注意:请在直播间开播后,再去抓取弹幕,否则抓不到!

搭建直播间,进行开播

可参考AI音频直播流程,完成 模特配置,智能化书,智能互动,保护配置四大项,就开始搭建直播伴侣

1 确保数字人形象输入至 直播伴侣中(使用窗口模式或者选择c920虚拟摄像头,推荐先用窗口模式)
2 自行配置好直播间贴片与装修
3 完成视频号刷粉,满足PC端口开播粉丝量要求
4 点击一直播软件内的开始直播
5 视频号伴侣内点击商品管理,选择好自己的品,点击开播
开始直播

弹幕抓取

点击一直播软件内的弹幕抓取,扫码登录

弹幕抓取

补充功能:场控助手(非必须建议先跳过)

场控助手在保护配置页面中。使用它第一件事就是 在用户屏蔽中 输入自己直播账号的用户名,避免出现自己回答自己的情况。

用户屏蔽

随后的点击启动场控助手,开启直播后,点击启动场控,拖拽弹出的红色方框至视频号直播伴侣的输入位置

启动场控

随后的点击确定位置,即可触发场控。最后在话术内容中设置要手动发送的内容,点击开始发送,即可定时发送文本内容。该功能是通过识别发送按钮和发送框来进行文字场控和AI智能文本回复,必须开启直播后才能启用

场控配置

声音克隆录制教程

录制高质量音频样本,用于AI声音克隆。

语音定制

格式、时长

提供10-20秒的音频,格式支持mp3、wav、m4a等,内容是完整流畅的一段话,避免出现长时间停顿等。注意:请尽量不要大于这个时长,避免声音合成出错

音频质量

录制环境

为了提高语音复刻和合成的质量,一定要保持录制环境低噪声和低混响(有条件的可以如在10平米以内的房间录音、最好有吸音装置等)。

录制的数据需要保持在同一声学环境下采集,避免拼接多段来源不一致的声音(即使是同一个说话人)。

录制的时候,需要保持音量相对均匀,距离麦克风距离适中,不要大幅度改变和麦的距离(避免音量过高、过低或者不稳定)。

避免不必要的环境音,比如椅子响动、录制设备(手机或麦克风)移动、衣服摩擦、喝水、咳嗽等。

录制内容

【重要】录音前熟记要录制的文案,避免读稿的不自然(否则会导致合成出来的音色也会有不自然的效果、复刻模型质量可能远低于公模)。

必须是单一说话人说话。

韵律和情绪饱满,如果需要复刻的结果表现力强,录制过程避免过于平淡的情绪。

语速自然,句子之间有正常的停顿(不要刻意停太久)。

直播间录制

可以录制抖音视频号以及快手上你觉得比较好的主播声音,录制直播间的要求如下:

1 直播间不能出现音乐
2 直播间不能出现副播的声音以及按铃声的声音
3 主播在正常直播的过程中会有平稳的语调以及激动憋单的语调都录制下来
4 去剪映把主播完整的一段10到20秒的音频截下来,进行克隆
03

玩法介绍

手机直播

使用手机进行直播,支持抖音等平台,随时随地开播。

苹果手机设置

非常重要!!!!

苹果手机请 APP store 搜索 "360极速浏览器",下载下面这个极速浏览器

360极速浏览器

访问地址

手机直播的客户可使用:

http://114.55.208.1:5006/

使用手机版意味着你可以在手机上使用一直播的功能,但注意,手机版仅支持纯音频直播,不支持录播!!!手机版和电脑版的数据是互通的,但请不要同时登陆手机版和电脑版,这样会导致直播异常中断!!!

所有操作和电脑端相同,包括登陆,克隆音色,新建直播间,创建商品,生成话术,配置互动地址,设置关键词,设置互动间隔,设置屏蔽词等。

完成直播间配置后,就可以开始直播了!!

SORA2视频生成

利用AI技术,将文字或图片转化为高质量视频内容。

功能入口

一直播系统支持SORA2视频生成功能,在软件首页下方选择视频生成,进入视频生成主页。选择SORA2视频生成进入页面。

视频生成入口 SORA2选择

生成步骤

上传一张或多张图片,注意一定不要上传带人物的图片!!随后对希望生成的内容进行描述,选择生成比例,点击立即生成即可。等待生成结束即可在作品管理中看到生成的视频。

画面去重

实时处理画面素材,达到防封和去重的目的。

功能介绍

无论是本地视频播,RTMP流播还是抖音直播转播,一直播系统均支持画面去重!!!

支持的去重方式

画面去重支持以下配置,均可以自行设置间隔和相关范围,请结合自身需要使用!!!!

🖼️ 画中画叠加
🔄 随机镜像
🎬 随机抽帧
📳 画面抖动
🎨 色彩偏移
📐 随机画面倾斜

注意事项

画面去重对CPU的要求较高,没有必要全部打开!!!根据自身CPU的情况开启去重!

抖音转播

一键转播其他直播内容,并通过平台的"手持报时"类验证。

功能介绍

一直播可以实现抖音直播,多平台转播,只需在抖音开播,输入链接到一直播系统中即可实现转播。

操作步骤

选择抖音直播转播模式,在下方输入抖音直播间地址。

选择抖音转播模式

抖音链接在网页直播间的上方获取!!!!!!

获取抖音链接

点击开始播放,等待直播缓存120秒,即可弹出转播窗口。

视频号手持手机报时

专门针对视频号平台,能AI自动完成180秒的报时验证流程。

实拍视频报时模式

最新报时的方法,只要正确操作基本100%过报时。原理就是把你拍摄的,跟当前直播场景一样的报时视频插入,然后用ai克隆视频的声音,把真人报时语音中时间部分给修改。这样整体非常自然流畅而且ai内容占比很少,通过几率非常高。注意,报时视频一定要保证拍摄的跟你录播素材的场景,人物,光线等基本一致,报时视频前面的口播时间在40秒左右。

AI生成视频报时

AI生成视频报时,适用于没有自己人货场用来拍摄报时视频的用户,现阶段过得几率低不推荐。

API配置

使用该功能,首先要注册阿里云百炼平台账号,并充值,具体可参考阿里百炼API配置教程

按照正常直播流程开播,在智能互动中配置阿里云百炼平台的API-KEY,确保平台余额充足,即可正常使用该功能。

API配置

验证流程

随后在开播弹出按照类似下方的验证要求时,点击开始视频报时即可。视频报时将在点击后80-100秒内返回开始,满足平台180秒的要求。

验证要求

手持ID提示词

视频中人物正面平视镜头,面部无表情,嘴巴做说话动作。人物右手匀速从拾起一张纯白矩形卡片(尺寸约5x10cm),以稳定速度向自身右上方移动。卡片最终悬停于人物胸口前方,高度与人物肩齐平,卡片挡住嘴唇。卡片中央呈现纯黑色字体的"一直播"字样,无其他图文元素。整个过程保持人物嘴唇完全不可见。持卡动作保持15秒,手臂匀速下降将卡片精准放回原位置。全流程仅执行单次举放动作。

手持ID示例

手持手机报时提示词

视频中的人物脸正对镜头,不做表情,嘴巴做说话动作,举起手机,手机屏幕为纯黑色,屏幕中央清晰地显示着当时实时的准确北京时间,时间为白色数字时间{time},此外没有任何其他内容。手机不会挡住人脸,动作持续10秒,动作仅单次,结束后手机放在腰间。

手持手机报时示例

多路直播

同时向多个不同平台的直播间推流开播,扩大影响力。

获取拉流地址

点击推流直播开关,开启直播,获取拉流地址(把拉流地址复制):

拉流地址

更换声音模型

如果开启直播显示没有算力可以更换声音模型继续开播:

更换声音模型

安装base.apk

在手机端安装base.apk软件,安装成功如图所示,安装成功后点开:

安装base.apk

VLC串流设置

点击VLC,在更多选择新建串流,将拉流地址复制到输入框中,在后台开始直播成功后点击播放。

VLC串流设置

任务管理

点击任务管理键,或者从手机底部向上滑动手势:

任务管理

画中画模式

对于vlc应用选择画中画模式,手机没有出现画中画选择,就在手机设置里面找到分屏使用分屏:

画中画模式

应用分屏

应用分屏示例⬇:

应用分屏示例

抖音直播

打开抖音手机版app,点击+点击直播开始视频直播,直播的时候留意播放的音频流是否停止,停止需重新播放。

抖音直播

多直播间管理

软件点击返回后,可以看到该直播间的状态是直播中,继续进入另外一个直播间重复以上操作,最多可以开启10个直播间。

一直播数字人玩法

使用云电脑进行数字人直播,无需本地高性能设备。

V2形象实时驱动与互动

最基础,最稳定,口型效果最好的数字人驱动模式,准备一段视频(可以是任意长度,几分钟到几小时都可以),在系统中选择v2形象克隆即可使用。克隆速度快,10分钟视频克隆约花费10分钟。可以通过选择闭口视频生成来提升口型自然度。推荐在你的配置大于等于3050 2060的时候使用。

V2形象实时驱动

在这个模式下,数字人会实时不断的对口型说出话术,在有弹幕进来要互动,或者要报时的时候,会实时对口型回复弹幕,回复速度最快效果最好。

V1形象实时驱动

低配置电脑专用的实时驱动。克隆的时候克隆版本选择v1即可。会新增两个训练参数,一般不用动。训练要花费很长时间,低配电脑上可能要好几个小时,请耐心等待。注意!!!!!v1克隆对素材要求高,必须要你的克隆素材有声音,声音跟人物口型对得上,画面干净清晰,才能取得不错的效果。一般1060 1650及以上显卡可以用这个。

V1形象实时驱动

数字人缓存驱动

这个模式是针对1060这种低配电脑,想用v2快速克隆和最佳口型的用户设计。它的原理就是用v2形象模型提前生成好对口型的数字人视频,然后在有弹幕需要互动或者报时的时候,把数字人音频闪避,用ai语音来回复。这个模式下强烈建议每场都主动修改一下话术,系统会重新生成对应段落的数字人视频,以保证不重复,不违规。

数字人缓存驱动

原音原画驱动

这个可以理解为"能在互动的时候,实时对口型的录播"。选择视频后开播,在正常的情况下会播放视频里面的原音频和原画面,相当于放录播。然后有弹幕要互动,或者报时的时候,就会实时改画面里面人物的口型来做回复。相当于既有了录播的转化效果,又有数字人直播的互动能力。配置需求是3050 2060及以上可用。

某音原画驱动

双数字人驱动

更新后,驱动模式中新增双人视频驱动。

双数字人驱动

选择双人视频

选择双人视频驱动,选择驱动原视频。注意原视频必须是竖屏!!且包含两个人物!!而且必须是闭嘴!!!!

推荐自己拍摄双数字人模特,也可以在剪映中把两个数字人模特剪辑在一起,也可以用AI数字人模特生成站来制作双数字人开口说话视频。在得到视频后,一定要用形象克隆中的生成双数字人闭口视频功能处理视频后,才能正常驱动。

选择双人视频

设置输出模式

选择输出模式(窗口或虚拟摄像头),并分别设置主播音色和助播音色!(默认原视频中左边人物为主播,右边为助播)

设置输出模式

话术配置与开始直播

话术中可以使用{助:xxxxxx}的格式来规定助播话术。

各位老哥老姐,咱们今天聊聊过年的事儿啊。{助:你看这时间过得多快,转眼就快到2026年马年了,是吧?}过年嘛,最开心的就是孩子们,盼着穿新衣、放鞭炮,还有就是收红包啦!咱们中国人讲究这个,红色代表喜庆,红包更是寄托着长辈对晚辈的祝福。

随后点击开播即可开始双数字人直播。左边说主播话术,右边说助播话术。

话术配置与开始直播

AI生成数字人模特形象

根据文本描述或图片,直接生成可以用于克隆使用的直播的形象,支持多种风格。

AI数字人模特生成站

访问地址:http://114.55.14.32:5474/

核心功能是可以根据文本描述,或者给的一张图片,直接生成可以在一直播中克隆,用于直播的形象。同时,他还集成了sora2视频生成,nanobanana图片生成与编辑的功能。

数字人模特生成向导使用方法

步骤1:进入网站,切换到数字人这一栏

进入数字人栏目

步骤2:点击输入框下方的直播数字人视频创作向导,按自己对模特的需求选择好标签,如模特的年龄,着装,背景等。点击生成提示词之后,点击下一步

选择标签生成提示词

步骤3:等待生成模特形象预览图,选择喜欢的形象,点击下一步即可生成

步骤4:最后按性别选择默认声音,ai会驱动图片生成自然说话有自然肢体动作的视频,生成完毕即可下载下来克隆。视频超分的意思就是让模特变得更加清晰,建议都开启。生成流程请保证有足够的积分

选择声音生成视频

自定义模特生成

对于有经验的客户,可以自己先生成图片,再生成音频,来生成更符合自己需求的模特

步骤1:先用图片生成功能,自行编写提示词,生成自己想要的模特图片,不会写可以问豆包

图片生成功能

步骤2:选择自己的声音进行克隆,输入文本进行合成。注意!!!!!!!音频长度绝对不要超过3分钟,推荐1到2分钟,不然无法正确合成,而且有几率扣除积分!!!!!!!!请在生成数字人前自行检查好

声音克隆
04

第三方平台注册

MinMaxAPI配置教程

配置MinMax平台的API密钥,启用AI对话功能。

注册账号

访问MinMax官网:https://platform.minimaxi.com/login

如已有账号则直接登陆即可,如没有账号,则输入姓名/公司名、手机号、密码,并输入验证码进行注册

MinMax官网

实名认证

注册完成后,登陆系统Minmax开放平台,点击上方菜单栏账户管理,随后点击右侧开始实名认证

个人认证可选择银行卡认证、扫脸认证,点击根据相关流程完成认证即可。企业用户则点击下方企业实名认证提供相关材料进行认证。完成认证后显示已完成个人认证或已完成企业认证。

实名认证

获取API Key

在账户管理页面的右侧,点击接口密钥,随后点击页面中的创建新的密钥,在弹窗中输入名称并点击创建密钥

获取API Key

复制API Key

创建成功后弹出密钥这里复制后一定要妥善保管!!!点击确定按钮后即不能复制了,因此在这里一定要复制完并保存

复制API Key

获取Group ID

在账户管理页面的右侧,点击账户信息,随后即可在页面中看到GroupID

获取Group ID

填写配置

最后请妥善保管自己的API KEY和Group ID。正常在Minmax开放平台充值后即可使用。

填写配置

智谱平台API配置教程

配置智谱AI平台的API,使用GLM大语言模型。

注册账号

访问智谱平台官网:https://open.bigmodel.cn

智谱平台官网

找到API Key

在控制台页面找到API Key

获取API Key

获取API Key

可以用默认的API Key秘钥,也可以自己新建

获取API Key

填写API Key

在一直播我的页面填入API Key秘钥,选择【glm-4-flash模型】保存配置

阿里百炼API配置教程

配置阿里云百炼平台的API,使用通义千问大模型。

注册账号

访问阿里云百炼官网:https://dashi.aliyun.com/activity/aigc?userCode=e1pfxeyk

根据官网指示进行注册及登陆

阿里云百炼官网

找到密钥管理

点击上方菜单的模型,随后在左下角找到密钥管理

找到密钥管理

创建API Key

第一次点击密钥管理后,并没有生成API Key,我们根据官网指示

创建API Key

开通服务

鼠标悬停在创建API-KEY按钮上,可以看到提示:还未开通模型服务,暂不能使用该功能。我们点击去开通

开通服务

确认开通

点击后,弹出如下窗口,点击确认开通,并领取免费额度

确认开通

等待开通

等待即可

等待开通

创建密钥

开通完成后,可以看到创建API-KEY按钮已变为可点击状态,我们直接点击

创建密钥

确定创建

点击后弹出窗口,点击确定即可

确定创建

复制密钥

随后可以看到生成了一个API-KEY,即可复制并在软件中使用

复制密钥

充值使用

注意:需正常在阿里云平台中进行充值才可使用,具体计费规则可查看阿里云百炼平台。

火山引擎API配置教程

配置字节跳动火山引擎的API,使用豆包大模型。

注册账号

访问火山引擎官网:https://console.volcengine.com/auth/login

火山引擎官网

开通管理

在火山引擎控制台开通DeepSeek-V3模型权限

开通模型权限

找到API Key

在API Key管理页面获取API Key

获取API Key

复制API Key

复制获取到的API Key

复制API Key

填写API Key

在一直播我的页面填写API Key秘钥,选择【DeepSeek-V3-250324模型】保存配置

硅基流动API配置教程

配置硅基流动平台的API,使用多种AI模型服务。

注册账号

访问硅基流动官网:https://cloud.siliconflow.cn/i/pKaBRleo

硅基流动官网

找到API秘钥

在控制台页面找到API秘钥

找到API秘钥

新建API秘钥

新建API秘钥

新建API秘钥

复制API秘钥

复制API秘钥

复制API秘钥

填写API秘钥

在一直播我的页面填入API Key秘钥,选择【自己想使用的模型】保存配置

填写API秘钥
05

常见问题

问题图标

hjzn_audio没有返回可用url?

检查音频是否正确用了20s以下的来克隆,如果不是重新克隆。

问题图标

数字人运行卡顿?

先检查配置:1050及以上,用数字人缓存模式跑流畅;1060 6g及以上,用v1实时数字人跑流畅;3050 2060及以上,用v2实时数字人流畅。是否满足要求,满足还是卡顿就阅读防卡顿文档,执行第一步复制exe

问题图标

快手或者抖音弹幕怎么连接不上?

输入的地址必须是直播间的网页地址,不能是分享地址。

问题图标

系统卡住不动或者数字人卡住不动?

大概率是点到windows控制台导致整个软件暂停了,不要去点那个黑色框也就是控制台。

问题图标

为什么打开软件闪退?

大概率是音频设备没有检测到,在声音设置里面切换一下音频设备即可正常进入。

问题图标

一键安装插件里面显卡部分显示检查失败?

先检查是不是N卡,系统不支持A卡。如果是N卡还提示失败那就是解压损坏了,下载360压缩,关掉杀毒软件去解压。

问题图标

直播过程可以修改话术吗?

不可以修改,软件开播后都不能调整。

问题图标

麦克风没有声音?

检查一键安装插件是否安装了虚拟麦克风,麦克风选择CABLE,可以参考文档虚拟声卡设置。

问题图标

大模型配置怎么弄?

参考第三方平台注册模块中的API配置教程。

问题图标

模特可以直播过程中更换吗?话术可以直播过程中更换吗?

不可以。

问题图标

什么情况下会扣云端算力?

只有一种情况,用云端声音同时开全自动改写,才会扣算力,其他情况一律不扣,而且所有功能都是正常工作。云端算力是用来跑声音合成的,形象还是放在电脑本地跑的。

问题图标

数字人支持2k吗?

比较吃性能,暂时不支持,在升级中。

问题图标

克隆形象的时候提示ffmpeg错误等?

大概率是本地硬盘没有空间了。

问题图标

软件占用的体积太大了?

这个一般是缓存问题,在我的页面里面点击清除缓存即可。

问题图标

知道账户名能查到密码吗?

可以,打开你们后台网页,按ctrl+f,输入账户就能查到密码。

问题图标

为什么网站生成数字人形象失败?

大概率是音频太长了,注意一定要3分钟以内,推荐2分钟以内。

问题图标

系统的配置够吗?

系统配置主要看显卡和cpu,在任务管理器->性能这一栏里面可以看到cpu和gpu的型号,截图发给ai让它看。如果没有图片或者截图没有显示显卡信息等,提示客户正确截图。

问题图标

双数字人模式怎么用?

剪辑好双人模特视频后,使用模特克隆页面生成双数字人闭口视频的功能生成视频后,即可使用双数字人驱动。注意,双数字人是左边的说主话术,右边的说助播话术,请手动编写助播话术。

问题图标

控制台显示doubao模型403报错?

百分百是因为自己豆包没钱,模型权限没有打开,apikey输入错误等问题,去按照火山引擎API配置教程配置。

问题图标

一直播最低要什么配置,要不要显卡?

现在要流畅跑是这样的:1050及以上,用数字人缓存模式跑流畅;1060 6g及以上,用v1实时数字人跑流畅;3050 2060及以上,用v2实时数字人流畅。必须要英伟达显卡也就是N卡,没有显卡跑不了

问题图标

这个数字人在直播间互动,怎么会乱说话?

大模型是根据你商品信息输入框写的内容做回复,一定要写清楚写精准了,不能乱写,绝对不能空着,不然ai不知道你在卖啥就会乱说。

问题图标

为什么ai音频会胡言乱语,不正常说话?

云端声音服务现在升级了,效果更真实,对素材要求更高,请正确用20秒无杂音音频克隆,提升原始音频质量,出来的效果就会非常好。

问题图标

为什么配置够但数字人形象卡顿?

需要把启动器复制一份,然后用新的启动器来启动系统,这个是windows自己的bug把我们软件限制了。视频参考

问题图标

为什么原音原画口型和声音对不上号?

这个是因为视频帧率不是25帧的原因,一定要进剪映转成25帧后再用。

问题图标

为什么语音会乱说出现奇怪的胡言乱语和杂音怎么语速快的不正常?

这个是声音模型升级了,效果比之前更真实但对素材要求更高,请一定用10秒干净声音来克隆,随便搞的素材效果不会好。

问题图标

主播话术总是被捣乱问问题的人打断,怎么设置?

在播放模式里面从打断回复切换到顺序播放,主播就会说完当前这句话再回复,不会自己打断自己。