安全公司报告
文库搜索
切换导航
文件分类
频道
联系我们
问题反馈
文件分类
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210854672.3 (22)申请日 2022.07.17 (71)申请人 扬州大学 地址 225009 江苏省扬州市大 学南路88号 (72)发明人 戴敏 沈雨田 陈建 王礼星 缪宏 张思瑞 葛永成 张燕军 张善文 刘思幸 杨坚 李芳芳 曾英 卞雯静 (51)Int.Cl. G06Q 30/02(2012.01) G06N 20/00(2019.01) G06K 9/62(2022.01) (54)发明名称 一种基于机器学习的二手车估价方法 (57)摘要 本发明涉及二手车估价技术领域, 尤其涉及 一种基于机器学习的二手车估价方法, 包括以下 步骤: 获取大量二手车交易数据作为原始训练数 据, 进行数据预处理; 计算原始数据对应的保值 率, 建立线性回归预测模型, 并且计算保值率阈 值 进而划分高低保值率数 据; 分别建立XGBoo st预测模型; 当需要预测任 意 二手车价格时, 本发明使用线性回归算法对于该 数据进行初步分类, 分类为高保值率或低保之旅 数据; 再导入对应的XGBoost预测模型, 进行价格 的预测。 相比于使用其他的机器学习算法, 本发 明将保值率概念, 线 性回归算法, XGBoo st算法三 者相结合对于价格预测问题可有效减小预测误 差。 权利要求书2页 说明书5页 附图1页 CN 115115414 A 2022.09.27 CN 115115414 A 1.一种基于 机器学习的二手车估价方法, 包括以下步骤: S1.数据处 理 获取一批二手车的特征参数以及成交价格, 记为原始数据集; 将原始数据集中的二手 车的价格特征参数进行数据预处理, 缺失值采用平均值代替, 当某数据大于平均数据10倍 以上时判断其 为异常数据, 并且 对其剔除; S2.线性模型训练以及阈值计算 计算原始数据集中的二手车对应保值 率, 保值率=成交价/新车价; 利用计算完保值 率的原始数据, 进行线性回归 模型的训练, 步骤如下: 步骤(1): 根据二手车特征变量作为自变量, 保值率作 为因变量, 建立线性回归方程。 设 Up表示第p个自变量, ti为第i个二手车的保值率, 则可建立ti=β0+β1U1+β2U2+…+βpUp+ε, 其 中p≥2, ε为 误差且 ε~(0, σ2), βi为系数; 步骤(2): 设(Ui1, Ui2,…Uip, ti)是(U1, U2, ...Up, t)的独立观测值, 其中i=1, 2, …n, 则多 元线性模型ti=β0+β1Ui1+β2Ui2…+βpUip+ εi; 步骤(3): 求最小二乘函数, Q(β)=(t ‑Uβ)T(t‑Uβ)当β最小时, 线性经验回归为 步骤(4): 将二手 车原始数据导入线 性经验回归公式中, 拟合出系数βi, 即可求解出保值 率线性预测模型; 将计算保值率阈值k, 其中数据总量表示为n, xi表示各条数 据对应保值 率, 公式中的u为常量, 默认选取0.4; 依据数据对应保值 率是否大于阈值 k, 将数据划分为高保值 率数据以及低保值 率数据; S3.XGBoost预测模型训练 分别进行高/低保值 率预测模型训练, 步骤如下(以高保值 率数据为例): 步骤(1): 基于MATLAB构建XGBoost预测模型, 对于包含n条m维的二手车数据集, 预测二 手车价格模型可表示为: 其中, yi表示二手车 价格, xi表示输入的第i个样本数据; fk(xi)表示第K棵决策树; fk为树几何空间F的一个函 数; 步骤(2): 构建该模型的核心任务是找到最优 的Obj并建立预测方程, 目标函数可分为 误 差 函 数 项 L 和 模 型 复 杂 函 数 项 Ω , 所以 O b j = L + Ω , 其中, γ和λ表示加权因子, T为叶子节点个数wj表示叶子节点权重。 在使用训练数据时对模型进 行优化训练时, 需要保留原有模型不变, 加入一个新的函数f到 模型中, 使目标函数尽可能的减少; 步骤(3): 此时目标函数表示为: Obj是 可作为评价模型的打分函数, Obj值越小则模型效果越好。 通过递归调用上述树的建立方 法, 可得到大量回归树结构, 并使用Obj 搜索最优的树结构, 从而最优的XGBoost模 型建立完 毕;权 利 要 求 书 1/2 页 2 CN 115115414 A 2步骤(4): 将训练数据数据导入建立 好的XGBo ost模型中, 得到训练好的预测模型。 S4.二手车价格预测 将待确定价格的二手车的特征数据进行筛选, 只保留新车价格, 使用年限, 行驶里程, 车身体积, 年 款, 品牌id作为影响参数; 将待确定价格的二手车的特征数据导入线性 回归模型进行初步分类, 得到该二手车属 于高保值 率或低保值 率数据; 根据数据类型导入高/低保值 率XGBoost预测模型, 进行价格预测。 2.如权利要求1所述的一种基于机器学习的二手车估价方法, 其特征在于, 所述线性 回 归模型以车辆的新车价格, 使用年限, 行驶里程, 车身体积, 年款, 品牌id作为影响参数, 保 值率作为输出参数。 3.如权利要求1所述的一种基于机器学习的二手车估价方法, 其特征在于, 所述 XGBoost预测 模型以车辆的新车价格, 使用年限, 行驶里程, 车身体积, 年款, 品牌id作为影 响参数, 二手车价格作为输出参数。权 利 要 求 书 2/2 页 3 CN 115115414 A 3
专利 一种基于机器学习的二手车估价方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 06:27:54
上传分享
举报
下载
原文档
(445.2 KB)
分享
友情链接
T-QGCML 1699—2023 经营数据中台可视化运维监管云平台.pdf
GB-T 29309-2012 电工电子产品加速应力试验规程 高加速寿命试验导则.pdf
GM-T 0006-2012 密码应用标识规范.pdf
DB61-T 1502-2021 电动汽车充电站(桩)验收规范 陕西省.pdf
DL-T 711-2019 汽轮机调节保安系统试验导则.pdf
青藤 - 2021 安全规划:三步搞定安全流程管理.pdf
NY-T 886-2022 农林保水剂.pdf
DB3502-T 056.1-2020 政务信息共享协同平台 第1部分:总体设计 厦门市.pdf
T-ACEF 034—2022 城镇供水管网数字化技术指南.pdf
GB 4943.1-2022 音视频、信息技术和通信技术设备 第1部门 安全要求.pdf
DL-T 2045-2019 中性点不接地系统铁磁谐振防治技术导则.pdf
6-31-07-02 工业视觉系统运维员.pdf
GB-T 5599-2019 机车车辆动力学性能评定及试验鉴定规范.pdf
GW0204-2014 国家电子政务外网 安全管理系统技术要求与接口规范.pdf
GB-T 41255-2022 智能工厂 通用技术要求.pdf
GB-T 29490-2023 企业知识产权合规管理体系 要求.pdf
GB-T 38772-2020 煤液化沥青.pdf
GB-T 5048-2017 防潮包装.pdf
GB-T 28534-2012 高压开关设备和控制设备中六氟化硫(SF6)气体的释放对环境和健康的影响.pdf
GB-T 36007-2018 锄草机器人通用技术条件.pdf
交流群
-->
1
/
3
9
评价文档
赞助2元 点击下载(445.2 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。