安全公司报告
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210854672.3 (22)申请日 2022.07.17 (71)申请人 扬州大学 地址 225009 江苏省扬州市大 学南路88号 (72)发明人 戴敏 沈雨田 陈建 王礼星  缪宏 张思瑞 葛永成 张燕军  张善文 刘思幸 杨坚 李芳芳  曾英 卞雯静  (51)Int.Cl. G06Q 30/02(2012.01) G06N 20/00(2019.01) G06K 9/62(2022.01) (54)发明名称 一种基于机器学习的二手车估价方法 (57)摘要 本发明涉及二手车估价技术领域, 尤其涉及 一种基于机器学习的二手车估价方法, 包括以下 步骤: 获取大量二手车交易数据作为原始训练数 据, 进行数据预处理; 计算原始数据对应的保值 率, 建立线性回归预测模型, 并且计算保值率阈 值 进而划分高低保值率数 据; 分别建立XGBoo st预测模型; 当需要预测任 意 二手车价格时, 本发明使用线性回归算法对于该 数据进行初步分类, 分类为高保值率或低保之旅 数据; 再导入对应的XGBoost预测模型, 进行价格 的预测。 相比于使用其他的机器学习算法, 本发 明将保值率概念, 线 性回归算法, XGBoo st算法三 者相结合对于价格预测问题可有效减小预测误 差。 权利要求书2页 说明书5页 附图1页 CN 115115414 A 2022.09.27 CN 115115414 A 1.一种基于 机器学习的二手车估价方法, 包括以下步骤: S1.数据处 理 获取一批二手车的特征参数以及成交价格, 记为原始数据集; 将原始数据集中的二手 车的价格特征参数进行数据预处理, 缺失值采用平均值代替, 当某数据大于平均数据10倍 以上时判断其 为异常数据, 并且 对其剔除; S2.线性模型训练以及阈值计算 计算原始数据集中的二手车对应保值 率, 保值率=成交价/新车价; 利用计算完保值 率的原始数据, 进行线性回归 模型的训练, 步骤如下: 步骤(1): 根据二手车特征变量作为自变量, 保值率作 为因变量, 建立线性回归方程。 设 Up表示第p个自变量, ti为第i个二手车的保值率, 则可建立ti=β0+β1U1+β2U2+…+βpUp+ε, 其 中p≥2, ε为 误差且 ε~(0, σ2), βi为系数; 步骤(2): 设(Ui1, Ui2,…Uip, ti)是(U1, U2, ...Up, t)的独立观测值, 其中i=1, 2, …n, 则多 元线性模型ti=β0+β1Ui1+β2Ui2…+βpUip+ εi; 步骤(3): 求最小二乘函数, Q(β)=(t ‑Uβ)T(t‑Uβ)当β最小时, 线性经验回归为 步骤(4): 将二手 车原始数据导入线 性经验回归公式中, 拟合出系数βi, 即可求解出保值 率线性预测模型; 将计算保值率阈值k, 其中数据总量表示为n, xi表示各条数 据对应保值 率, 公式中的u为常量, 默认选取0.4; 依据数据对应保值 率是否大于阈值 k, 将数据划分为高保值 率数据以及低保值 率数据; S3.XGBoost预测模型训练 分别进行高/低保值 率预测模型训练, 步骤如下(以高保值 率数据为例): 步骤(1): 基于MATLAB构建XGBoost预测模型, 对于包含n条m维的二手车数据集, 预测二 手车价格模型可表示为: 其中, yi表示二手车 价格, xi表示输入的第i个样本数据; fk(xi)表示第K棵决策树; fk为树几何空间F的一个函 数; 步骤(2): 构建该模型的核心任务是找到最优 的Obj并建立预测方程, 目标函数可分为 误 差 函 数 项 L 和 模 型 复 杂 函 数 项 Ω , 所以 O b j = L + Ω , 其中, γ和λ表示加权因子, T为叶子节点个数wj表示叶子节点权重。 在使用训练数据时对模型进 行优化训练时, 需要保留原有模型不变, 加入一个新的函数f到 模型中, 使目标函数尽可能的减少; 步骤(3): 此时目标函数表示为: Obj是 可作为评价模型的打分函数, Obj值越小则模型效果越好。 通过递归调用上述树的建立方 法, 可得到大量回归树结构, 并使用Obj 搜索最优的树结构, 从而最优的XGBoost模 型建立完 毕;权 利 要 求 书 1/2 页 2 CN 115115414 A 2步骤(4): 将训练数据数据导入建立 好的XGBo ost模型中, 得到训练好的预测模型。 S4.二手车价格预测 将待确定价格的二手车的特征数据进行筛选, 只保留新车价格, 使用年限, 行驶里程, 车身体积, 年 款, 品牌id作为影响参数; 将待确定价格的二手车的特征数据导入线性 回归模型进行初步分类, 得到该二手车属 于高保值 率或低保值 率数据; 根据数据类型导入高/低保值 率XGBoost预测模型, 进行价格预测。 2.如权利要求1所述的一种基于机器学习的二手车估价方法, 其特征在于, 所述线性 回 归模型以车辆的新车价格, 使用年限, 行驶里程, 车身体积, 年款, 品牌id作为影响参数, 保 值率作为输出参数。 3.如权利要求1所述的一种基于机器学习的二手车估价方法, 其特征在于, 所述 XGBoost预测 模型以车辆的新车价格, 使用年限, 行驶里程, 车身体积, 年款, 品牌id作为影 响参数, 二手车价格作为输出参数。权 利 要 求 书 2/2 页 3 CN 115115414 A 3

.PDF文档 专利 一种基于机器学习的二手车估价方法

文档预览
中文文档 9 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于机器学习的二手车估价方法 第 1 页 专利 一种基于机器学习的二手车估价方法 第 2 页 专利 一种基于机器学习的二手车估价方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:27:54上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。