(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211431106.8
(22)申请日 2022.11.16
(71)申请人 北京红棉小 冰科技有限公司
地址 100080 北京市海淀区北四环西路67
号6层608房间
(72)发明人 杜晓薇 王宝元
(74)专利代理 机构 北京路浩知识产权代理有限
公司 11002
专利代理师 王治东
(51)Int.Cl.
H04L 51/02(2022.01)
H04L 51/10(2022.01)
H04N 19/44(2014.01)
G06K 9/62(2022.01)
G10L 19/16(2013.01)
(54)发明名称
具有人格特 征的信息生成方法及装置
(57)摘要
本申请提供一种具有人格特征的信息生成
方法及装置, 涉及数据处理技术领域, 该方法包
括: 根据人机交互任务的任务需求, 确定与所述
任务需求相匹配的目标人格数据, 并根据所述目
标人格数据创建目标虚拟人; 基于所述目标虚拟
人生成具有人格特征的目标信息。 本申请提供的
具有人格特征的信息生成方法及装置, 用于为语
音助手或聊天机器人赋予人格, 使其在与用户的
交互过程中输出 具有人格特 征的信息 。
权利要求书3页 说明书15页 附图3页
CN 115499396 A
2022.12.20
CN 115499396 A
1.一种具有人格特 征的信息生成方法, 其特 征在于, 包括:
根据人机交互任务的任务需求, 确定与所述任务需求相匹配的目标人格数据, 并根据
所述目标 人格数据创建目标虚拟人;
基于所述目标虚拟人生成具有人格特 征的目标信息;
其中, 所述目标人格数据为人格模型基于对真实的个体交互信息进行训练后得到的;
所述人格模型 的训练过程包括: 将个体交互信息解耦为与人格相关特征和人格无关特征,
并基于人格相关特 征和人格无关特 征对输入的个 体交互信息进行重构。
2.根据权利要求1所述的方法, 其特征在于, 所述根据人机交互任务的任务需求, 确定
与所述任务需求相匹配的目标人格数据, 并根据所述 目标人格数据创建目标虚拟人之前,
所述方法还 包括:
根据输入的目标样本数据的数据类型, 使用与 所述目标样本数据的数据类型相匹配的
编码器对所述目标样本数据进 行解耦, 得到与目标人格相关的第一特征向量以及与所述目
标人格无关的第二特 征向量;
其中, 所述目标样本数据为基于互联网用户发布的个体交互信息生成的; 所述目标人
格标识为基于所述目标样本数据的人格标签指示的人格标识确定的; 输出所述第一特征向
量的编码器为第一编码器; 输出 所述第二特 征向量的编码器为第二编码器。
3.根据权利要求2所述的方法, 其特征在于, 所述根据输入的目标样本数据的数据类
型, 使用与所述目标样本数据 的数据类型相匹配的自编码器对所述目标样本数据进行解
耦, 得到与所述目标人格相关的第一特征向量以及与所述目标人格无关的第二特征向量之
前, 所述方法还 包括:
获取不同互联网用户发布的个体交互信 息, 并基于获取的个体交互信 息构建训练样本
集; 所述个 体交互信息包括以下至少一项: 音频信息, 图像信息, 文本信息;
基于人格库中的人格标识对所述训练样本集中的每个样本数据进行人格标注, 确定每
个样本数据对应的人格标签;
其中, 所述目标样本数据为所述训练样本集中的任一样本数据; 所述人格库中包括多
个人格标识; 每 个人格标识对应一个人格, 一个人格对应多个人格特 征。
4.根据权利要求3所述的方法, 其特征在于, 所述目标人格标识在所述人格库中对应多
个静态特 征向量;
根据输入的目标样本数据的数据类型, 使用与 所述目标样本数据的数据类型相匹配的
编码器对所述目标样本数据进 行解耦, 得到与目标人格相关的第一特征向量以及与所述目
标人格无关的第二特 征向量之后, 所述方法还 包括:
根据所述第一特 征向量计算所述多个静态特 征向量中每 个静态特 征向量的权 重;
根据每个静态特征向量的权重对所述多个静态特征向量进行加权计算, 得到所述目标
样本数据对应的动态特 征向量;
将所述动态特征向量以及所述第二特征向量输入到与所述目标样本数据的数据类型
相匹配的解码器中进行解码, 得到 重构后的目标样本数据;
其中, 所述目标样本数据与重构后的目标样本数据所表示的内容相同。
5.根据权利要求2至4中任一项所述的方法, 其特征在于, 所述根据输入的目标样本数
据的数据类型, 使用与所述目标样本数据的数据类型相匹配的编 码器对所述目标样本数据权 利 要 求 书 1/3 页
2
CN 115499396 A
2进行解耦, 得到与目标人格相关的第一特征向量以及与所述目标人格无关的第二特征向量
之后, 所述方法还 包括:
将所述第二特征向量输入第 一分类器中, 通过所述第 一分类器识别所述第 二特征向量
中是否存在与人格标识相关的特 征;
基于所述第一分类器的识别结果调整所述第二编码器的模型参数以及所述第一分类
器的模型参数, 以提高所述第一分类器 从所述第二编 码器的输出结果中识别出与人格标识
相关特征的能力, 以及降低所述第二编 码器输出的特征向量被所述第一分类器识别出与人
格标识相关特 征的概率。
6.根据权利要求4所述的方法, 其特征在于, 所述根据每个静态特征向量的权重对所述
多个静态特征向量进行加权计算, 得到所述 目标样本数据对应的动态特征向量之后, 所述
方法还包括:
将所述动态特征向量输入到第 二分类器中, 通过所述第 二分类器识别所述目标样本数
据对应的人格, 并根据识别结果调整所述第一编码器的模型参数、 所述第二分类器的模型
参数以及所述多个静态特 征向量。
7.根据权利要求4所述的方法, 其特征在于, 所述根据每个静态特征向量的权重对所述
多个静态特征向量进行加权计算, 得到所述 目标样本数据对应的动态特征向量之后, 所述
方法还包括:
将所述动态特征向量、 所述第二特征向量以及第三特征向量输入到第三分类器中, 通
过所述第三分类器识别所述目标样本数据的人格标识, 并根据识别结果调整 所述第一编码
器的模型参数、 所述第二编码器的模型参数、 所述第三分类器的模型参数以及所述多个静
态特征向量;
其中, 所述第三特征向量为与所述目标人格无关的特征向量、 且所述第三特征向量与
所述第二特 征向量的来源不同。
8.根据权利要求 4所述的方法, 其特 征在于, 所述方法还 包括:
将所述多个静态特征向量进行拼接后输入第四分类器中, 通过所述第四分类器识别所
述多个静态特征向量对应的人格标识, 并根据识别结果调整所述第四分类器的模型参数、
所述第一编码器的模型参数以及所述多个静态特 征向量。
9.根据权利要求4所述的方法, 其特征在于, 所述基于所述目标虚拟人生成具有人格特
征的目标信息, 包括:
获取所述目标虚拟人需要输出的输出内容;
使用与所述输出内容的数据类型相匹配的编码器对所述输出内容进行编码, 得到与 所
述目标人格数据对应的目标 人格无关的第一目标 特征向量;
根据所述目标人格数据对应的多个静态特征向量中每个静态特征向量的权重对所述
目标人格数据对应的多个静态特征向量进 行加权计算, 得到所述目标人格数据对应的目标
人格相关的第二目标 特征向量;
将所述第一目标特征向量以及所述第二目标特征向量输入到与所述输出内容的数据
类型相匹配的解码器中进行解码, 得到所述目标信息;
其中, 所述目标信息为人格模型对所述输出内容进行重构后得到的。
10.一种具有人格特 征的信息生成装置, 其特 征在于, 所述装置包括:权 利 要 求 书 2/3 页
3
CN 115499396 A
3
专利 具有人格特征的信息生成方法及装置
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:42:55上传分享