系统设置与安装
虚拟声卡设置
配置虚拟声卡以实现更好的音频输出效果,支持多路音频混流。
打开控制面板-点击硬件和声音-管理音频设备-选择扬声器
在"播放"栏里设"CABLE Input"为默认设备
在"录制"栏里将"CABLE Output"设为默认播放设备
直播伴侣音频设置
打开直播设置-点击音频
麦克风选择设置选项为"CABLE Output(VB-Audio Virtual)"
扬声器选择设置选项为"CABLE Input(VB-Audio Virtual)"
数字人开播后可以看到输入音量表有波动,如果输入音量表未有波动,请检查各项设置,并重新启动数字人直播。
视频号的音频设置
视频号的音频输入选择"CABLE Output(VB-Audio Virtual)"
视频号的扬声器选项一定要选择静音
快手的音频设置
打开直播设置-点击声音
麦克风选择"CABLE Output(VB-Audio Virtual Cable)"
快手的扬声器选项一定要选择静音
系统安装文档
电脑准备
安装软件:抖音直播伴侣,360压缩,chrome浏览器,百度网盘,todesk
https://streamingtool.douyin.com/?ref=www.pinduojie.com
360压缩 https://yasuo.360.cn/
chrome浏览器 https://www.google.cn/intl/zh-CN/chrome/
百度网盘 https://pan.baidu.com/download#win
todesk https://www.todesk.com/
系统配置:台式电脑,Windows操作系统,无具体配置要求。可以租用云电脑
软件下载
网站首页点击软件下载获取百度网盘最新系统下载链接,进行下载。推荐开百度网盘会员,方便后续第一时间升级系统
软件解压
右键正常进行解压即可,这里不要解压到中文路径了,也不要点到解压到当前文件夹,即图中箭头指出的选项
插件安装
进入系统,点击一键安装插件.exe,对虚拟摄像头,虚拟麦克风,逐个点击安装。全部安装一遍后,关闭一键安装插件.exe再次打开,确认所有文本都显示绿色。
点击后请耐心等待安装,不要乱动⚠️⚠️⚠️
安装虚拟摄像头,点击即可。
关闭防火墙,点击即可。
安装.net插件,点击按流程安装即可。
安装webview插件,点击按流程安装即可。
最后再次打开一次软件,看文本是不是都变成了绿色。
启动软件
启动软件,看到登录页面正确出现就算安装完成。
虚拟内存设置
配置系统虚拟内存以确保软件运行流畅,特别是在使用数字人直播时。
设置步骤
先找到此电脑右键此电脑找到属性,点击属性,会弹出系统页面。
找到高级系统设置,点击高级系统设置,然后会弹出一个系统属性新页面。
在弹出的系统属性里面,点击高级->第一个设置按钮->点高级->点击虚拟内存区域的更改按钮,然后给每一个盘都选择自定义大小,两个框都输入16000,点击确定,最后重启电脑即可。
开播必学
快速开播教程
从零开始,5分钟内完成首次开播配置。
需要准备(以视频号为例)
启动数字人模块
检查更新,将一直播系统更新到最新版本
一键安装插件,从上到下依次点击,出现如下图显示的绿色即是全部插件安装完成
双击启动"一直播"应用程序
账号注册与登录
点击注册,使用邮箱注册账号,按照流程设置用户名密码,并正确接收填写验证码。新注册账号后可通过卡密进行充值
输入刚刚注册好的账号密码,点击"登录",登录一直播系统
启动后将管理员给的算力卡密和会员天数的卡密充值在个人账户里
设置大模型
在我的--大模型配置中输入对应的大模型api key
目前支持的厂商有火山智谱硅基流动,配置可参考第三方平台注册
声音克隆
(1)云端克隆
点击下方声音克隆,进入声音管理页面。点击右上角克隆声音按钮。选择录制好的声音,输入声音名称,选择是否使用Minmax云端克隆(注意,使用Minmax云端克隆要额外配置专用apikey,可以不用开启)。手机录音机录制即可,录制期间不要有其他杂音,主播说话要听的清楚,吐词清晰,语速最好平播不要太快,中途可以休息几秒不说话,说错话不要紧正常录制。音频长度10到20秒即可,绝对不能搞的太长否则可能造成语音合成失败!
点击开始克隆,耐心等待克隆完成,克隆过程中不要关闭软件!!!!
(2)本地克隆
点击下方声音克隆,进入声音管理页面。点击右上角克隆声音按钮。选择录制好的声音,输入声音名称,选择本地克隆(超拟真)【本地克隆不消耗自己的算力,克隆不会扣除自己账户里的算力,但是声音更真实,耗时也较久,需要耐心等待】
点击开始克隆,耐心等待克隆完成,克隆过程中不要关闭软件!!!!
形象克隆
下方菜单栏新增 形象克隆,点击后进入形象管理页面。点击克隆形象,上传对应视频,输入模特名称,点击开始克隆,等待克隆完成即可。
V1 形象 对性能要求相对较低,但对素材要求比较高,不推荐使用
V2 形象(推荐)对性能有一定要求,显卡大于1660s即可使用,详情可见显卡天梯图
数字人模特录制要求请参考 形象克隆录制教程
直播间创建
克隆完声音后创建直播间,点击右上角创建直播间,然后点击进入直播间(可以创建其他平台直播间,这里仅以抖音为例)
开启数字人直播
创建一个 直播类型为 数字人直播的直播间,并点击进入直播间,并按照以下顺序进行直播间设置
模特配置页面
选择好使用hjzn_audio声音,选择好音色,选择好数字人模特,选择好画面输出方式即可,其他默认即可。画面选择虚拟摄像头输出可以提升清晰度,在伴侣里面选择名为c920的摄像头即可看到画面。
注意:使用虚拟摄像头输出必须正确点击一键安装插件内的安装虚拟摄像头按钮。如果因系统环境变化而导致虚拟摄像头找不到,修复方法参考:1 下载obs 2 关掉我们的软件 3 在obs里面点击启动虚拟摄像头,然后关闭obs 4 在一键安装插件里面再点击安装摄像头 5 重启电脑
智能话术页面
AI会根据商品信息来生成话术和与直播间弹幕和观众进行互动。商品信息必须写的清晰足够详细,绝对不能不写!写清楚商品信息后点击AI生成话术,自己审查一遍话术的效果。
以下是更详细的商品信息模板 👇👇👇👇
商品类型:林阿荣无盐茯苓薏米山药线面 福建特产 龙须面 挂面
价格:十五块九买5袋线面再送5袋线面
●二十二块九买10袋线面再送10袋线面
● 五十二块九买20袋线面再送20袋线面
● 二十二块九还能选择买10袋线面送10包红烧牛肉调味包
适用人群:男女老少都可以食用
优势:控糖减脂的 某糖某高的 老人家小朋友小宝宝跟哺乳期妈妈都可以吃
产品优势:成分是茯苓薏米山药小麦粉加水啊 茯苓薏米上的成分呢 占比含量做到了40%以上 纯纯的谷物杂粮 没有任何的额外添加 像大家问的很多的什么硼砂 明胶食用胶都没有放啊 盐巴也没有放含钠量是为0的 真正的0钠0添加 可以当主食辅食 当代餐 1分钟不到就可以煮好
售后保障:
●极速退款
●7天无理由退换
●48小时内发货,晚发即赔
快递:默认极兔快递,需要圆通或邮政发货的请联系客服备注哦,48小时内在福建发货
外套商品信息模板案例二 👇👇👇👇
商品类型:加绒加厚一体绒外套
价格:39.9元
适用人群:男女通用,适合17-80岁年龄段
适用身高:145-175cm都可穿着
衣长:66-69cm(每码数增加1cm)
尺码建议:正常码数正常选择,偏瘦/卡码建议选大一码
重量参考:130斤选4XL,95斤选2XL
保暖性能:
● 一体绒材质,不掉毛不跑毛
● 前胸、后背、袖子都有加绒
● 保暖称3秒发热,5秒恒温锁温
● 防风保暖效果好
售后保障:
● 提供运费险
● 7天无理由退换
● 支持多件试穿后选择保留
款式颜色:
● 提供多色可选:米白色、皮粉色、红色、紫色、绿色、蓝色等
● 建议年长者选择红色、紫色等喜庆色系
● 风格休闲百搭
互动配置页面
智能互动分为三个板块,互动配置,关键词问答,互动间隔配置
互动配置页面主要 输入直播间分享链接,其他配置在快速开播流程中不建议修改,使用默认设置即可。
如果是视频号直播,点击后扫码登陆即可
视频号直播间链接格式:https://live.douyin.com/881086335519(这里是你自己的直播间地址,浏览器打开直播间网页后复制链接进去)
快手直播间链接格式:https://live.kuaishou.com/u/shc77077(这里是你自己的直播间地址,浏览器打开直播间网页后复制链接进去)
注意:请在直播间开播后,再去抓取弹幕,否则抓不到!
搭建直播间,进行开播
可参考AI音频直播流程,完成 模特配置,智能化书,智能互动,保护配置四大项,就开始搭建直播伴侣
弹幕抓取
点击一直播软件内的弹幕抓取,扫码登录
补充功能:场控助手(非必须建议先跳过)
场控助手在保护配置页面中。使用它第一件事就是 在用户屏蔽中 输入自己直播账号的用户名,避免出现自己回答自己的情况。
随后的点击启动场控助手,开启直播后,点击启动场控,拖拽弹出的红色方框至视频号直播伴侣的输入位置
随后的点击确定位置,即可触发场控。最后在话术内容中设置要手动发送的内容,点击开始发送,即可定时发送文本内容。该功能是通过识别发送按钮和发送框来进行文字场控和AI智能文本回复,必须开启直播后才能启用
声音克隆录制教程
录制高质量音频样本,用于AI声音克隆。
语音定制
格式、时长
提供10-20秒的音频,格式支持mp3、wav、m4a等,内容是完整流畅的一段话,避免出现长时间停顿等。注意:请尽量不要大于这个时长,避免声音合成出错
音频质量
录制环境
为了提高语音复刻和合成的质量,一定要保持录制环境低噪声和低混响(有条件的可以如在10平米以内的房间录音、最好有吸音装置等)。
录制的数据需要保持在同一声学环境下采集,避免拼接多段来源不一致的声音(即使是同一个说话人)。
录制的时候,需要保持音量相对均匀,距离麦克风距离适中,不要大幅度改变和麦的距离(避免音量过高、过低或者不稳定)。
避免不必要的环境音,比如椅子响动、录制设备(手机或麦克风)移动、衣服摩擦、喝水、咳嗽等。
录制内容
【重要】录音前熟记要录制的文案,避免读稿的不自然(否则会导致合成出来的音色也会有不自然的效果、复刻模型质量可能远低于公模)。
必须是单一说话人说话。
韵律和情绪饱满,如果需要复刻的结果表现力强,录制过程避免过于平淡的情绪。
语速自然,句子之间有正常的停顿(不要刻意停太久)。
直播间录制
可以录制抖音视频号以及快手上你觉得比较好的主播声音,录制直播间的要求如下:
玩法介绍
手机直播
使用手机进行直播,支持抖音等平台,随时随地开播。
苹果手机设置
非常重要!!!!
苹果手机请 APP store 搜索 "360极速浏览器",下载下面这个极速浏览器
访问地址
手机直播的客户可使用:
http://114.55.208.1:5006/
使用手机版意味着你可以在手机上使用一直播的功能,但注意,手机版仅支持纯音频直播,不支持录播!!!手机版和电脑版的数据是互通的,但请不要同时登陆手机版和电脑版,这样会导致直播异常中断!!!
所有操作和电脑端相同,包括登陆,克隆音色,新建直播间,创建商品,生成话术,配置互动地址,设置关键词,设置互动间隔,设置屏蔽词等。
完成直播间配置后,就可以开始直播了!!
SORA2视频生成
利用AI技术,将文字或图片转化为高质量视频内容。
功能入口
一直播系统支持SORA2视频生成功能,在软件首页下方选择视频生成,进入视频生成主页。选择SORA2视频生成进入页面。
生成步骤
上传一张或多张图片,注意一定不要上传带人物的图片!!随后对希望生成的内容进行描述,选择生成比例,点击立即生成即可。等待生成结束即可在作品管理中看到生成的视频。
画面去重
实时处理画面素材,达到防封和去重的目的。
功能介绍
无论是本地视频播,RTMP流播还是抖音直播转播,一直播系统均支持画面去重!!!
支持的去重方式
画面去重支持以下配置,均可以自行设置间隔和相关范围,请结合自身需要使用!!!!
注意事项
画面去重对CPU的要求较高,没有必要全部打开!!!根据自身CPU的情况开启去重!
抖音转播
一键转播其他直播内容,并通过平台的"手持报时"类验证。
功能介绍
一直播可以实现抖音直播,多平台转播,只需在抖音开播,输入链接到一直播系统中即可实现转播。
操作步骤
选择抖音直播转播模式,在下方输入抖音直播间地址。
抖音链接在网页直播间的上方获取!!!!!!
点击开始播放,等待直播缓存120秒,即可弹出转播窗口。
视频号手持手机报时
专门针对视频号平台,能AI自动完成180秒的报时验证流程。
实拍视频报时模式
最新报时的方法,只要正确操作基本100%过报时。原理就是把你拍摄的,跟当前直播场景一样的报时视频插入,然后用ai克隆视频的声音,把真人报时语音中时间部分给修改。这样整体非常自然流畅而且ai内容占比很少,通过几率非常高。注意,报时视频一定要保证拍摄的跟你录播素材的场景,人物,光线等基本一致,报时视频前面的口播时间在40秒左右。
AI生成视频报时
AI生成视频报时,适用于没有自己人货场用来拍摄报时视频的用户,现阶段过得几率低不推荐。
API配置
使用该功能,首先要注册阿里云百炼平台账号,并充值,具体可参考阿里百炼API配置教程。
按照正常直播流程开播,在智能互动中配置阿里云百炼平台的API-KEY,确保平台余额充足,即可正常使用该功能。
验证流程
随后在开播弹出按照类似下方的验证要求时,点击开始视频报时即可。视频报时将在点击后80-100秒内返回开始,满足平台180秒的要求。
手持ID提示词
视频中人物正面平视镜头,面部无表情,嘴巴做说话动作。人物右手匀速从拾起一张纯白矩形卡片(尺寸约5x10cm),以稳定速度向自身右上方移动。卡片最终悬停于人物胸口前方,高度与人物肩齐平,卡片挡住嘴唇。卡片中央呈现纯黑色字体的"一直播"字样,无其他图文元素。整个过程保持人物嘴唇完全不可见。持卡动作保持15秒,手臂匀速下降将卡片精准放回原位置。全流程仅执行单次举放动作。
手持手机报时提示词
视频中的人物脸正对镜头,不做表情,嘴巴做说话动作,举起手机,手机屏幕为纯黑色,屏幕中央清晰地显示着当时实时的准确北京时间,时间为白色数字时间{time},此外没有任何其他内容。手机不会挡住人脸,动作持续10秒,动作仅单次,结束后手机放在腰间。
多路直播
同时向多个不同平台的直播间推流开播,扩大影响力。
获取拉流地址
点击推流直播开关,开启直播,获取拉流地址(把拉流地址复制):
更换声音模型
如果开启直播显示没有算力可以更换声音模型继续开播:
安装base.apk
在手机端安装base.apk软件,安装成功如图所示,安装成功后点开:
VLC串流设置
点击VLC,在更多选择新建串流,将拉流地址复制到输入框中,在后台开始直播成功后点击播放。
任务管理
点击任务管理键,或者从手机底部向上滑动手势:
画中画模式
对于vlc应用选择画中画模式,手机没有出现画中画选择,就在手机设置里面找到分屏使用分屏:
应用分屏
应用分屏示例⬇:
抖音直播
打开抖音手机版app,点击+点击直播开始视频直播,直播的时候留意播放的音频流是否停止,停止需重新播放。
多直播间管理
软件点击返回后,可以看到该直播间的状态是直播中,继续进入另外一个直播间重复以上操作,最多可以开启10个直播间。
一直播数字人玩法
使用云电脑进行数字人直播,无需本地高性能设备。
V2形象实时驱动与互动
最基础,最稳定,口型效果最好的数字人驱动模式,准备一段视频(可以是任意长度,几分钟到几小时都可以),在系统中选择v2形象克隆即可使用。克隆速度快,10分钟视频克隆约花费10分钟。可以通过选择闭口视频生成来提升口型自然度。推荐在你的配置大于等于3050 2060的时候使用。
在这个模式下,数字人会实时不断的对口型说出话术,在有弹幕进来要互动,或者要报时的时候,会实时对口型回复弹幕,回复速度最快效果最好。
V1形象实时驱动
低配置电脑专用的实时驱动。克隆的时候克隆版本选择v1即可。会新增两个训练参数,一般不用动。训练要花费很长时间,低配电脑上可能要好几个小时,请耐心等待。注意!!!!!v1克隆对素材要求高,必须要你的克隆素材有声音,声音跟人物口型对得上,画面干净清晰,才能取得不错的效果。一般1060 1650及以上显卡可以用这个。
数字人缓存驱动
这个模式是针对1060这种低配电脑,想用v2快速克隆和最佳口型的用户设计。它的原理就是用v2形象模型提前生成好对口型的数字人视频,然后在有弹幕需要互动或者报时的时候,把数字人音频闪避,用ai语音来回复。这个模式下强烈建议每场都主动修改一下话术,系统会重新生成对应段落的数字人视频,以保证不重复,不违规。
原音原画驱动
这个可以理解为"能在互动的时候,实时对口型的录播"。选择视频后开播,在正常的情况下会播放视频里面的原音频和原画面,相当于放录播。然后有弹幕要互动,或者报时的时候,就会实时改画面里面人物的口型来做回复。相当于既有了录播的转化效果,又有数字人直播的互动能力。配置需求是3050 2060及以上可用。
双数字人驱动
更新后,驱动模式中新增双人视频驱动。
选择双人视频
选择双人视频驱动,选择驱动原视频。注意原视频必须是竖屏!!且包含两个人物!!而且必须是闭嘴!!!!
推荐自己拍摄双数字人模特,也可以在剪映中把两个数字人模特剪辑在一起,也可以用AI数字人模特生成站来制作双数字人开口说话视频。在得到视频后,一定要用形象克隆中的生成双数字人闭口视频功能处理视频后,才能正常驱动。
设置输出模式
选择输出模式(窗口或虚拟摄像头),并分别设置主播音色和助播音色!(默认原视频中左边人物为主播,右边为助播)
话术配置与开始直播
话术中可以使用{助:xxxxxx}的格式来规定助播话术。
各位老哥老姐,咱们今天聊聊过年的事儿啊。{助:你看这时间过得多快,转眼就快到2026年马年了,是吧?}过年嘛,最开心的就是孩子们,盼着穿新衣、放鞭炮,还有就是收红包啦!咱们中国人讲究这个,红色代表喜庆,红包更是寄托着长辈对晚辈的祝福。
随后点击开播即可开始双数字人直播。左边说主播话术,右边说助播话术。
AI生成数字人模特形象
根据文本描述或图片,直接生成可以用于克隆使用的直播的形象,支持多种风格。
AI数字人模特生成站
访问地址:http://114.55.14.32:5474/
核心功能是可以根据文本描述,或者给的一张图片,直接生成可以在一直播中克隆,用于直播的形象。同时,他还集成了sora2视频生成,nanobanana图片生成与编辑的功能。
数字人模特生成向导使用方法
步骤1:进入网站,切换到数字人这一栏
步骤2:点击输入框下方的直播数字人视频创作向导,按自己对模特的需求选择好标签,如模特的年龄,着装,背景等。点击生成提示词之后,点击下一步
步骤3:等待生成模特形象预览图,选择喜欢的形象,点击下一步即可生成
步骤4:最后按性别选择默认声音,ai会驱动图片生成自然说话有自然肢体动作的视频,生成完毕即可下载下来克隆。视频超分的意思就是让模特变得更加清晰,建议都开启。生成流程请保证有足够的积分
自定义模特生成
对于有经验的客户,可以自己先生成图片,再生成音频,来生成更符合自己需求的模特
步骤1:先用图片生成功能,自行编写提示词,生成自己想要的模特图片,不会写可以问豆包
步骤2:选择自己的声音进行克隆,输入文本进行合成。注意!!!!!!!音频长度绝对不要超过3分钟,推荐1到2分钟,不然无法正确合成,而且有几率扣除积分!!!!!!!!请在生成数字人前自行检查好
第三方平台注册
MinMaxAPI配置教程
配置MinMax平台的API密钥,启用AI对话功能。
注册账号
实名认证
注册完成后,登陆系统Minmax开放平台,点击上方菜单栏账户管理,随后点击右侧开始实名认证
个人认证可选择银行卡认证、扫脸认证,点击根据相关流程完成认证即可。企业用户则点击下方企业实名认证提供相关材料进行认证。完成认证后显示已完成个人认证或已完成企业认证。
获取API Key
在账户管理页面的右侧,点击接口密钥,随后点击页面中的创建新的密钥,在弹窗中输入名称并点击创建密钥
复制API Key
创建成功后弹出密钥这里复制后一定要妥善保管!!!点击确定按钮后即不能复制了,因此在这里一定要复制完并保存
获取Group ID
在账户管理页面的右侧,点击账户信息,随后即可在页面中看到GroupID
填写配置
最后请妥善保管自己的API KEY和Group ID。正常在Minmax开放平台充值后即可使用。
智谱平台API配置教程
配置智谱AI平台的API,使用GLM大语言模型。
注册账号
访问智谱平台官网:https://open.bigmodel.cn
找到API Key
在控制台页面找到API Key
获取API Key
可以用默认的API Key秘钥,也可以自己新建
填写API Key
在一直播我的页面填入API Key秘钥,选择【glm-4-flash模型】保存配置
阿里百炼API配置教程
配置阿里云百炼平台的API,使用通义千问大模型。
注册账号
进入控制台
找到密钥管理
点击上方菜单的模型,随后在左下角找到密钥管理
创建API Key
第一次点击密钥管理后,并没有生成API Key,我们根据官网指示
开通服务
鼠标悬停在创建API-KEY按钮上,可以看到提示:还未开通模型服务,暂不能使用该功能。我们点击去开通
确认开通
点击后,弹出如下窗口,点击确认开通,并领取免费额度
等待开通
等待即可
创建密钥
开通完成后,可以看到创建API-KEY按钮已变为可点击状态,我们直接点击
确定创建
点击后弹出窗口,点击确定即可
复制密钥
随后可以看到生成了一个API-KEY,即可复制并在软件中使用
充值使用
注意:需正常在阿里云平台中进行充值才可使用,具体计费规则可查看阿里云百炼平台。
火山引擎API配置教程
配置字节跳动火山引擎的API,使用豆包大模型。
注册账号
开通管理
在火山引擎控制台开通DeepSeek-V3模型权限
找到API Key
在API Key管理页面获取API Key
复制API Key
复制获取到的API Key
填写API Key
在一直播我的页面填写API Key秘钥,选择【DeepSeek-V3-250324模型】保存配置
硅基流动API配置教程
配置硅基流动平台的API,使用多种AI模型服务。
注册账号
找到API秘钥
在控制台页面找到API秘钥
新建API秘钥
新建API秘钥
复制API秘钥
复制API秘钥
填写API秘钥
在一直播我的页面填入API Key秘钥,选择【自己想使用的模型】保存配置
常见问题
hjzn_audio没有返回可用url?
检查音频是否正确用了20s以下的来克隆,如果不是重新克隆。
数字人运行卡顿?
先检查配置:1050及以上,用数字人缓存模式跑流畅;1060 6g及以上,用v1实时数字人跑流畅;3050 2060及以上,用v2实时数字人流畅。是否满足要求,满足还是卡顿就阅读防卡顿文档,执行第一步复制exe
快手或者抖音弹幕怎么连接不上?
输入的地址必须是直播间的网页地址,不能是分享地址。
系统卡住不动或者数字人卡住不动?
大概率是点到windows控制台导致整个软件暂停了,不要去点那个黑色框也就是控制台。
为什么打开软件闪退?
大概率是音频设备没有检测到,在声音设置里面切换一下音频设备即可正常进入。
一键安装插件里面显卡部分显示检查失败?
先检查是不是N卡,系统不支持A卡。如果是N卡还提示失败那就是解压损坏了,下载360压缩,关掉杀毒软件去解压。
直播过程可以修改话术吗?
不可以修改,软件开播后都不能调整。
麦克风没有声音?
检查一键安装插件是否安装了虚拟麦克风,麦克风选择CABLE,可以参考文档虚拟声卡设置。
大模型配置怎么弄?
参考第三方平台注册模块中的API配置教程。
模特可以直播过程中更换吗?话术可以直播过程中更换吗?
不可以。
什么情况下会扣云端算力?
只有一种情况,用云端声音同时开全自动改写,才会扣算力,其他情况一律不扣,而且所有功能都是正常工作。云端算力是用来跑声音合成的,形象还是放在电脑本地跑的。
数字人支持2k吗?
比较吃性能,暂时不支持,在升级中。
克隆形象的时候提示ffmpeg错误等?
大概率是本地硬盘没有空间了。
软件占用的体积太大了?
这个一般是缓存问题,在我的页面里面点击清除缓存即可。
知道账户名能查到密码吗?
可以,打开你们后台网页,按ctrl+f,输入账户就能查到密码。
为什么网站生成数字人形象失败?
大概率是音频太长了,注意一定要3分钟以内,推荐2分钟以内。
系统的配置够吗?
系统配置主要看显卡和cpu,在任务管理器->性能这一栏里面可以看到cpu和gpu的型号,截图发给ai让它看。如果没有图片或者截图没有显示显卡信息等,提示客户正确截图。
双数字人模式怎么用?
剪辑好双人模特视频后,使用模特克隆页面生成双数字人闭口视频的功能生成视频后,即可使用双数字人驱动。注意,双数字人是左边的说主话术,右边的说助播话术,请手动编写助播话术。
控制台显示doubao模型403报错?
百分百是因为自己豆包没钱,模型权限没有打开,apikey输入错误等问题,去按照火山引擎API配置教程配置。
一直播最低要什么配置,要不要显卡?
现在要流畅跑是这样的:1050及以上,用数字人缓存模式跑流畅;1060 6g及以上,用v1实时数字人跑流畅;3050 2060及以上,用v2实时数字人流畅。必须要英伟达显卡也就是N卡,没有显卡跑不了
这个数字人在直播间互动,怎么会乱说话?
大模型是根据你商品信息输入框写的内容做回复,一定要写清楚写精准了,不能乱写,绝对不能空着,不然ai不知道你在卖啥就会乱说。
为什么ai音频会胡言乱语,不正常说话?
云端声音服务现在升级了,效果更真实,对素材要求更高,请正确用20秒无杂音音频克隆,提升原始音频质量,出来的效果就会非常好。
为什么配置够但数字人形象卡顿?
需要把启动器复制一份,然后用新的启动器来启动系统,这个是windows自己的bug把我们软件限制了。视频参考
为什么原音原画口型和声音对不上号?
这个是因为视频帧率不是25帧的原因,一定要进剪映转成25帧后再用。
为什么语音会乱说出现奇怪的胡言乱语和杂音怎么语速快的不正常?
这个是声音模型升级了,效果比之前更真实但对素材要求更高,请一定用10秒干净声音来克隆,随便搞的素材效果不会好。
主播话术总是被捣乱问问题的人打断,怎么设置?
在播放模式里面从打断回复切换到顺序播放,主播就会说完当前这句话再回复,不会自己打断自己。