基于数据驱动的纯电动汽车用户分群与行驶里程预测研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:wlg1991
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
全文阅读
纯电动汽车因其以蓄电池作为唯一动力来源,具有低污染、低噪音、能量转化效率高等特点有助于缓解日益严峻的能源与环境问题。在全球各国政府的大力倡导和政策扶持下,纯电动汽车市场发展潜力巨大。但随着纯电动汽车的强势增长,其用户群体的消费和需求逐渐呈现多元化和层次化特性,且用户普遍存在“里程焦虑”现象。为适应市场发展需求和增强用户使用信心,本文依托纯电动汽车的用户真实使用数据,对用户群体进行聚类分析,以刻画不同的用户群体画像,为企业市场定位和精准营销提供理论依据,同时,基于纯电动汽车的实际运行状态数据,对行驶里程进行预测研究,以提高用户满意度。因此,本研究课题具有一定的理论意义和实用价值。本论文以纯电动汽车用户使用数据为研究对象,利用机器学习的聚类分析和回归预测分析技术手段,围绕用户群体细分和行驶里程预测展开相关研究工作,主要研究内容如下:(1)基于FP-Kmeans算法的用户分群研究。首先梳理了聚类分析的研究理论和关键技术,为后续的研究内容奠定理论基础和技术支撑;接着基于体验用户数据,采用数据清洗技术和特征相关性分析技术得到包括14个特征变量的最优数据集;其次针对K-means算法的不足提出一种基于流形距离的FP-Kmeans算法,对用户进行聚类分群;然后对聚类的五类用户群体进行详细的消费能力和使用行为对比分析,并考虑企业业务实际需求给出筛选体验用户的建议;最后对体验用户关注点进行重点分析,研究发现行驶里程为用户最关心性能指标,占比达到46.3%,是阻碍用户选购纯电动汽车的重要原因之一,准确预测行驶里程可有助于缓解用户“里程焦虑”,为下一部分的研究奠定基础。(2)基于Light GBM模型的行驶里程预测研究。首先对回归预测分析的相关理论和分析技术进行总结概述;其次为提高后续预测的可靠性和准确度,在对纯电动汽车的运行状态数据进行特征工程处理后,经片段分割和特征拓展后得到15项特征变量作为模型输入;接着建立Light GBM预测模型,与其它主流回归预测模型进行对比分析,验证了Light GBM模型的有效性及优越性;最后使用Grid Search CV技术对Light GBM模型进行优化,并且利用SHAP对模型进行全局和局部解释分析。
其他文献
随着汽车工业的快速发展,作为影响汽车操纵稳定性与安全可靠性的悬架系统显得越来越重要。为了获得理想的减震效果,不断有新型的悬架系统被开发并应用于汽车,其中橡胶悬架系统由于具有重量轻、性能好等优点而得到汽车开发商越来越多的关注。本文基于校企合作项目,对一款应用于某汽车起重机的橡胶悬架进行研究,研究主要包括橡胶超弹性材料参数的反求、橡胶悬架均衡梁总成的有限元分析与结构优化。具体内容如下:首先,本文介绍了
等几何分析是21世纪初由国外学者提出的新型有限元分析方法,相较于传统有限元分析,该方法基于非均匀有理B样条基函数进行计算机辅助工程(Computer Aided Engineering,CAE)分析,实现了计算机辅助设计(Computer Aided Design,CAD)和CAE模型的无缝连接,也为闭环优化提供了理论依据。但由于非均匀有理B样条基函数张量积形式的局限性,当其用于构建复杂几何模型时
磺胺类抗生素(Sulfonamide antibiotics,SAs)因在预防或治疗人类和动物疾病、促进牲畜和农作物的生长等方面效果显著而被广泛应用。然而,近几十年来SAs的滥用,使其在水体中不断被检出,并诱导产生了“超级耐药菌”,危害生态环境和人类健康安全。高级氧化技术(Advanced oxidation processes,AOPs)因其稳定性好且对难降解有机污染物降解彻底而引起了水处理领域
在信息爆炸增长的时代,文本信息仍然是信息传递中不可或缺的一部分现今。目前,人们能从各个渠道获得大量的文本信息,但无法快速识别该文本哪些是需要的信息。人们能够高效获取文本信息的技术手段不多。BERT模型的出现为文档检索工作重新开辟了一片天地,由于该模型的通用性强和自我调节训练模型的优点,使其提取出来的文本信息,更加贴近实际需求。因此本文提出了基于BERT模型选取关键词的方法,通过对比计算词与文本之间
铁路列车作为交通运输的重要工具,其发展关系着国计民生。随着列车的日益发展,列车的安全运营也渐渐成为人们关注的焦点问题。传统的列车安全检测是依靠人工去列车箱底逐一排查,这样耗时耗力,还有可能因为视觉疲劳等因素导致错检漏检。因此,完善列车智能化自动检测系统十分必要。目标检测作为列车智能化自动检测系统中的重要一环,主要负责对列车零部件的监测。而由于工业领域下列车零部件数据的场景复杂性和物体尺度多变性,目
现如今,随着我国经济实力的快速提升,机动车的数量也在不断增加,机动车辆保险稳定的占据着财产保险中最大险种的地位。但是在我国的保险市场中,欺诈现象时有发生,据统计,欺诈案件涉及的金额至少占理赔总金额的20%,因此而造成的损失每年超过了200亿元。由此可见,如何准确有效地识别车险欺诈行为,是每个财险公司都需要解决的问题。本文对机动车辆保险欺诈的相关概念进行界定,对信息不对称理论、不完全合约理论和博弈论
生物催化具有反应条件温和、选择性高等特点,因而在工业催化中得到较多的应用。但天然酶通常也存在稳定性差、难以回收等问题,这些问题极大地限制其广泛应用。解决这些问题的策略有两种,一种是通过载体负载生物酶从而提高其稳定性和可回收性;另一种是开发具有生物催化活性的纳米材料。金属有机框架具有比表面积高、孔径和组分高度可调、可化学修饰性等特点,因而受到广泛关注。这些特征使得金属有机框架很合适通过上述两种策略解
找到形状之间有意义的匹配是几何处理中的一个基本问题。在形状匹配领域,人们习惯于将物体看作是一系列离散平面点的集合,而轮廓则是构造任何一个形状的边界线,相比于点集,它多了物体边界的顺序关系,是一种更高级别的视觉信息。近年来,基于轮廓的形状匹配方法取得了快速的发展,其中以形状上下文匹配算法最为经典,但这个领域仍有很多问题没有解决,如:形状匹配的大多数工作专注于寻找形状之间的相似程度,并不追求轮廓点集之
车身覆盖件的设计是整车设计和加工中相当关键的一个环节,目前车身覆盖件冲压工艺参数设计方法大多是采用数值优化方法,这种方法在进行工艺参数求解时容易陷入局部最优解,无法得出理想的加工参数。针对这种情况,本文设计并开发了基于B/S架构和案例推理的车身覆盖件冲压成形工艺参数设计专家系统。本文的主要研究内容如下:(1)确定采用三元向量组来组织表达车身覆盖件冲压案例,并且引入了属性量化概念,对三元向量组中的属
过去十年里,计算机视觉技术快速发展,人体动作识别作为计算机视觉领域重点研究方向之一,成为近些年来的研究热点。人体动作识别根据给定人体骨架关节等带有行为的运动序列进行分析,利用一系列技术方法,分析判别出具体动作类别。有效分析挖掘人体动作序列特征所包含的信息,快速准确识别出对应动作类别,是人体动作识别的重点内容。由于人体动作识别技术功能性强,其在视频监控安防、医疗监护、学习娱乐、自动驾驶汽车等方向有着