专利 一种在网时长差异识别方法、装置、设备及介质

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202211010101.8 (22)申请日 2022.08.23 (65)同一申请的已公布的文献号申请公布号 CN 115082135 A (43)申请公布日 2022.09.20 (73)专利权人成都乐超人科技有限公司地址 610000 四川省成都市高新区梓州大道6900号1栋622号 (72)发明人符金华　李欣　张家庆　聂文军　 (74)专利代理机构广州三环专利商标代理有限公司 44202 专利代理师周俊 (51)Int.Cl. G06Q 30/02(2012.01) G06F 16/22(2019.01)G06F 16/2458(2019.01) 审查员王诗玮 (54)发明名称一种在网时长差异识别方法、装置、设备及介质 (57)摘要本申请提供了一种在网时长差异识别方法、装置、设备及介质，用以解决现有技术中在网时长差异识别方法准确度低的问题。所述方法包括：根据预设分箱方法，对目标数据集和历史数据集进行分箱处理，得到第一目标分箱序列和第一历史分箱序列；当第一目标分箱序列和第一历史分箱序列不满足预设条件时，对第一目标分箱序列和/或第一历史分箱序列进行填充处理，得到第二目标分箱序列和第二历史分箱序列；根据预设算法、第二目标分箱序列和第二历史分箱序列，得到目标数据集与历史数据集的差异识别结果，从而获取现今市场与历史市场的用户在网时长之间的差异性识别结果。权利要求书3页说明书11页附图3页 CN 115082135 B 2022.11.18 CN 115082135 B 1.一种在网时长差异识别方法，其特征在于，所述方法包括：根据预设分箱方法，对目标数据集和历史数据集进行分箱处理，得到第一目标分箱序列和第一历史分箱序列；其中，将现今市场的用户在网时长作为目标数据集，将历史市场的用户在网时长作为历史数据集；所述目标数据集和所述历史数据集的数据项的数量均大于预设数量；当所述第一目标分箱序列和所述第一历史分箱序列不满足预设条件时，对所述第一目标分箱序列和/或所述第一历史分箱序列进行填充处理，得到第二目标分箱序列和第二历史分箱序列；其中，所述第二目标分箱序列和第二历史分箱序列的长度相同，并且所述第二目标分箱序列和所述第二历史分箱序列的索引映射相同；根据预设算法、所述第二目标分箱序列和所述第二历史分箱序列，得到所述目标数据集与所述历史数据集的差异识别结果，从而获取现今市场与历史市场的用户在网时长之间的差异性识别结果；通过差异性识别结果的正负判断用户群体在网时长分布是往时间更长的方向偏移还是往时间较短的方向偏移，从而达到认知市场情况与预警。 2.根据权利要求1所述的在网时长差异识别方法，其特征在于，所述当所述第一目标分箱序列和所述第一历史分箱序列不满足预设条件时，对所述第一目标分箱序列和/或所述第一历史分箱序列进行填充处理，得到第二目标分箱序列和第二历史分箱序列，包括：当所述第一目标分箱序列和所述第一历史分箱序列的长度不一致时，根据预设填充项，对第一目标分箱序列和所述第一历史分箱序列中长度短的序列进行填充，以得到第二目标分箱序列和第二历史分箱序列；当所述第一目标分箱序列和所述第一历史分箱序列的索引映射不一致时，根据所述第一目标分箱序列和所述第一历史分箱序列，获取目标索引序列和历史索引序列；根据所述目标索引序列、所述历史索引序列和所述预设填充项，对第一目标分箱序列和所述第一历史分箱序列进行填充处理，以得到第二目标分箱序列和第二历史分箱序列。 3.根据权利要求2所述的在网时长差异识别方法，其特征在于，所述根据所述目标索引序列、所述历史索引序列和所述预设填充项，对第一目标分箱序列和所述第一历史分箱序列进行填充处理，以得到第二目标分箱序列和第二历史分箱序列，包括：根据所述目标索引序列和所述历史索引序列，确定索引缺失位置；根据所述索引缺失位置和所述预设填充项，对第一目标分箱序列和所述第一历史分箱序列进行填充处理，以得到第二目标分箱序列和第二历史分箱序列。 4.根据权利要求1所述的在网时长差异识别方法，其特征在于，所述根据预设算法、所述第二目标分箱序列和所述第二历史分箱序列，得到所述目标数据集与所述历史数据集的差异识别结果，从而获取现今市场与历史市场的用户在网时长之间的差异性识别结果，包括：对所述第二目标分箱序列和所述第二历史分箱序列进行归一化处理，以得到第三目标分箱序列和第三历史分箱序列；根据所述第三目标分箱序列，确定目标索引值，其中，所述目标索引值对应所述第三目标分箱序列中的最大值；根据所述第三目标分箱序列、所述第三历史分箱序列和所述目标索引值，以得到所述权　利　要　求　书 1/3 页 2 CN 115082135 B 2目标数据集和历史数据集的差异识别结果，从而获取现今市场与历史市场的用户在网时长之间的差异性识别结果。 5.根据权利要求4所述的在网时长差异识别方法，其特征在于，所述根据所述第三目标分箱序列、所述第三历史分箱序列和所述目标索引值，以得到所述目标数据集和历史数据集的差异识别结果，从而获取现今市场与历史市场的用户在网时长之间的差异性识别结果，包括：根据预设公式、所述第三目标分箱序列、所述第三历史分箱序列和所述目标索引值，获取差异识别结果，其中，所述预设公式如下所示：式中，为所述第三目标分箱序列，为所述第三历史分箱序列， m为所述目标索引值， i和j均为正整数。 6.根据权利要求1所述的在网时长差异识别方法，其特征在于，所述根据预设分箱方法，对目标数据集和历史数据集进行分箱处理，得到第一目标分箱序列和第一历史分箱序列，包括：根据所述目标数据集的数据特征，确定分箱区间；根据所述分箱区间，对所述目标数据集和所述历史数据集进行分箱处理，以得到第一目标分箱序列和所述第一历史分箱序列。 7.根据权利要求1所述的在网时长差异识别方法，其特征在于，所述通过差异性识别结果的正负判断用户群体在网时长分布是往时间更长的方向偏移还是往时间较短的方向偏移，从而达到认知市场情况与预警，包括：当所述差异性识别结果为负数，则所述目标数据集相对于所述历史数据集向左偏移；当所述差异性识别结果为正数，则所述目标数据集相对于所述历史数据集向右偏移；基于上述差异性识别结果判断用户群体在网时长分布是往时间更长的方向偏移还是往时间较短的方向偏移，从而达到认知市场情况与预警。 8.一种在网时长差异识别装置，其特征在于，所述装置包括：分箱模块，用于根据预设分箱方法，对目标数据集和历史数据集进行分箱处理，得到第一目标分箱序列和第一历史分箱序列；其中，将现今市场的用户在网时长作为目标数据集，将历史市场的用户在网时长作为历史数据集；所述目标数据集和所述历史数据集的数据项的数量均大于预设数量；填充模块，用于当所述第一目标分箱序列和所述第一历史分箱序列不满足预设条件时，对所述第一目标分箱序列和/或所述第一历史分箱序列进行填充处理，得到第二目标分箱序列和第二历史分箱序列；其中，所述第二目标分箱序列和第二历史分箱序列的长度相同，并且所述第二目标分箱序列和所述第二历史分箱序列的索引映射相同；差异识别模块，用于根据预设算法、所述第二目标分箱序列和所述第二历史分箱序列，得到所述目标数据集与所述历史数据集的差异识别结果，从而获取现今市场与历史市场的用户在网时长之间的差异性识别结果；偏移方向判断模块，用于通过差异性识别结果的正负判断用户群体在网时长分布是往权　利　要　求　书 2/3 页 3 CN 115082135 B 3

专利 一种在网时长差异识别方法、装置、设备及介质

专利一种在网时长差异识别方法、装置、设备及介质