Uso de métodos de aprendizaje automático para predecir la penetración de vehículos eléctricos en el mercado automotriz
Scientific Reports volumen 13, Número de artículo: 8345 (2023) Citar este artículo
960 Accesos
2 Altmetric
Detalles de métricas
Los vehículos eléctricos (EV) se han introducido como una alternativa a los automóviles de gasolina y diésel para reducir las emisiones de gases de efecto invernadero, optimizar el uso de combustibles fósiles y proteger el medio ambiente. Predecir las ventas de vehículos eléctricos es trascendental para las partes interesadas, incluidos los fabricantes de automóviles, los encargados de formular políticas y los proveedores de combustible. Los datos utilizados en el proceso de modelado afectan significativamente la calidad del modelo de predicción. El conjunto de datos principal de esta investigación contiene ventas y registros mensuales de 357 vehículos nuevos en los Estados Unidos de América entre 2014 y 2020. Además de estos datos, se utilizaron varios rastreadores web para recopilar la información requerida. La venta de vehículos se pronosticó utilizando modelos de memoria a corto plazo (LSTM) y LSTM convolucional (ConvLSTM). Para mejorar el rendimiento de LSTM, se ha propuesto el modelo híbrido con una nueva estructura denominada "Hybrid LSTM with bidimensional Attention and Residual network". Además, los tres modelos se crean como modelos de aprendizaje automático automatizado para mejorar el proceso de modelado. El modelo híbrido propuesto funciona mejor que los otros modelos basados en las mismas unidades de evaluación, incluido el error porcentual absoluto medio, el error cuadrático medio normalizado, R-cuadrado, pendiente e intercepción de regresiones lineales ajustadas. El modelo híbrido propuesto ha sido capaz de predecir la proporción de vehículos eléctricos con un error absoluto medio aceptable del 3,5 %.
Las emisiones de gases de efecto invernadero están aumentando rápidamente en todo el mundo. Según un informe de la Agencia de Protección Ambiental de los Estados Unidos publicado en 2020, el sector del transporte produce alrededor del 27% de todas las emisiones de gases de efecto invernadero en el país, que, en comparación con otros sectores, el transporte emite la mayor cantidad de gases de efecto invernadero1. Los vehículos eléctricos se introdujeron como una alternativa a los automóviles de gasolina y diésel para reducir la contaminación del aire y las emisiones de gases de efecto invernadero, optimizar el uso de los recursos energéticos naturales y proteger el medio ambiente. El uso de electricidad generada a partir de fuentes de energía renovables como el viento, el agua y la luz solar para vehículos eléctricos puede ser una de las soluciones más eficientes para reducir las emisiones y el cambio climático2. Aunque ha pasado mucho tiempo desde la invención de los vehículos eléctricos, los vehículos de combustión interna siguen siendo los más populares. Las ventas de vehículos eléctricos han ido en aumento y, en enero de 2017, la cantidad total de vehículos eléctricos vendidos en todo el mundo alcanzó los dos millones3. A nivel mundial, las ventas de vehículos eléctricos representaron el 9% del mercado de automóviles en 2021, un aumento de cuatro veces desde 20194.
Diseñar y producir vehículos requiere mucho tiempo y mucha inversión, por lo que al predecir el número de ventas, las empresas automotrices pueden optimizar la producción. Además, al predecir con precisión la penetración de los vehículos eléctricos en el mercado, es posible estimar su impacto en la reducción de la contaminación. en los próximos años, lo cual es muy importante desde el punto de vista ambiental. Pronosticar la venta de vehículos eléctricos y su penetración en el mercado automotriz ha sido un tema importante para los gobiernos, los legisladores y los fabricantes de automóviles para planificar la producción de vehículos eléctricos, establecer políticas adecuadas y proporcionar suficiente energía e infraestructura.
El objetivo principal de esta investigación es aplicar métodos de Machine Learning (ML) para construir un modelo de predicción eficiente para estimar la venta de todos los vehículos en el conjunto de datos, la participación de EV en cada segmento y determinar los principales factores que influyen en las ventas de cada VE. El efecto de un número limitado de factores influyentes en las ventas de vehículos se examinó en estudios anteriores utilizando diferentes modelos. Para este estudio, se recopiló una amplia gama de información, incluidos todos los factores que estudios anteriores han demostrado que están relacionados con las ventas de automóviles, y se utilizó en el modelado. LSTM y ConvLSTM, potentes modelos de aprendizaje profundo (DL), se han utilizado para predecir las ventas de vehículos. Combinando el modelo de Atención bidimensional y la Red Residual como modelo híbrido propuesto, se ha intentado mejorar el rendimiento del modelo LSTM. Adicionalmente, utilizando la información recopilada y el análisis de sensibilidad del modelo, se intentó determinar los factores más influyentes en la venta de cada EV.
La revisión bibliográfica de este estudio incluye dos apartados generales. La primera sección examina los métodos de ML utilizados para predecir las ventas de vehículos, y la segunda sección proporciona una descripción general de las características utilizadas en otros métodos para predecir las ventas de vehículos eléctricos.
Varios estudios han utilizado métodos ML para predecir las ventas de vehículos eléctricos como datos de series temporales. Se compararon modelos de regresión lineal múltiple y máquina de vectores de soporte (SVM) para predecir las ventas de vehículos utilizando datos anuales, trimestrales y mensuales (la cantidad de registros de automóviles nuevos, la cantidad de ventas de automóviles e indicadores económicos como el Producto Interno Bruto (PIB), Ingreso Personal Disponible, Índice de Precios al Consumidor, Tasa de Interés, Tasa de Desempleo, Demanda de Inversión Industrial, Cargo por Petróleo, Consumo Privado y Demanda de Reemplazo Latente) en un estudio de Brühl et al.5 Según los resultados, el modelo SVM tuvo un mejor desempeño basado en en los valores de error (Mean Absolute Error y Mean Absolute Porcentage Error), fue más interpretable y dio mejores resultados basados en datos trimestrales. En el estudio de Wang et al. Se utilizaron técnicas de ML para predecir las ventas de automóviles en función de la cantidad de ventas, los indicadores económicos, la población mayorista, la tasa de desempleo, el tipo de cambio, los precios de los vehículos, los precios del petróleo y los precios de los componentes de los vehículos. Con base en unidades de evaluación (R-cuadrado y Error cuadrático medio), evaluaron la calidad de predicción del sistema de inferencia difusa basado en red adaptativa (ANFIS), las redes neuronales artificiales (ANN) y los modelos de media móvil integrados autorregresivos; los resultados mostraron que ANFIS funcionó mejor que los otros modelos6. En otro estudio, Hülsmann et al. comparó el rendimiento de los modelos lineales, como los mínimos cuadrados ordinarios y la regresión cuantil, con métodos de aprendizaje automático como SVM, árbol de decisiones, k-vecino más cercano y bosque aleatorio para predecir las ventas de vehículos. Con base en los datos mensuales de ventas de vehículos, registros de automóviles nuevos e indicadores económicos (como el PIB, los ingresos personales y el Dow Jones), los métodos del árbol de decisión de ML se desempeñaron mejor que los otros modelos basados en el error porcentual absoluto medio (MAPE)7 .
Además, Kitabci et al. analizó el impacto de las políticas económicas en las ventas de vehículos en Turquía como un factor macroambiental mediante métodos de regresión múltiple y redes neuronales. Evaluaron factores como la tasa de préstamo de vehículos presentada por los bancos, los ingresos de los consumidores, las deducciones fiscales realizadas por el gobierno para el automóvil, la tasa de inflación, los precios de los automóviles, el tipo de cambio del euro, los precios del petróleo y los anuncios gastados por los negocios Según los resultados, las redes neuronales fueron más precisas para predecir las ventas que los modelos de regresión; algunos factores, incluido el tipo de cambio del euro, las tasas de los préstamos para vehículos ofrecidos por los bancos y las deducciones fiscales del gobierno, han influido en las ventas de automóviles8. En otra investigación, Bas et al. aplicó métodos de clasificación ML para predecir la adopción de EV utilizando factores de abastecimiento de viajes, sociodemografía subyacente y características del vehículo; examinaron las contribuciones de diferentes factores para predecir los resultados utilizando un método llamado "Explicaciones agnósticas del modelo local interpretable". Según los hallazgos del estudio, los modelos ML produjeron predicciones muy precisas con respecto a la adopción de EV, y el uso frecuente de abastecimiento de viajes, el conocimiento sobre EV y la conciencia de protección ambiental fueron factores importantes para explicar la tendencia a adoptar EV9. Además, Zhang et al. aplicó el análisis de espectro singular como un modelo de serie temporal univariado y el modelo de autorregresión vectorial (VAR) como un modelo multivariado para pronosticar las ventas de vehículos eléctricos. De acuerdo con los resultados, el modelo VAR puede mejorar significativamente la precisión de la predicción porque considera el efecto de los indicadores económicos, como los precios al consumidor, la confianza del consumidor, los precios de los productores, los precios del combustible y los vehículos, y los datos de Baidu (un indicador de interés del consumidor y curiosidad en los vehículos eléctricos)10.
En otro estudio, Kaya et al.11 utilizaron el tipo de cambio, el PIB, el Índice de Confianza del Consumidor, los datos del Índice de Precios al Consumidor y un modelo de Red Neural Profunda para predecir las ventas de vehículos; los resultados revelaron que este modelo ML predijo las ventas con precisión (basado en el error cuadrático medio). En otra investigación, Xia et al. presentó el modelo ForeXGBoost, un sistema de predicción de ventas de vehículos basado en conjuntos de datos a gran escala que contienen información completa del vehículo, incluida la identificación de la marca, el modelo, la potencia del motor y el desplazamiento. Basado en la raíz cuadrada de la diferencia logarítmica, MAPE y el tiempo de ejecución, el modelo XGBoost supera a los algoritmos de referencia como la regresión lineal y los árboles de decisión de potenciación de gradiente12. Usando datos de encuestas en línea y métodos ML como SVM, ANN, Deep Neural Networks, Gradient Boosting Models y Random Forests, Bas et al. compararon diferentes métodos para clasificar a los compradores potenciales de vehículos eléctricos e identificar las características que afectan la adopción de vehículos eléctricos. Los resultados mostraron que el modelo SVM supera a los otros algoritmos; tener solo información parcial (p. ej., solo factores socioeconómicos) reduce el rendimiento del modelo, mientras que la sinergia entre múltiples variables aumenta la precisión13. Además, Saxena et al. presentan un estudio que examina el uso de modelos basados en el aprendizaje profundo, incluidos los promedios móviles de integración autorregresiva y los modelos LSTM, para predecir las direcciones futuras de las ventas de vehículos. Con base en los resultados de la implementación, se redujeron el MAE y el error cuadrático medio para el pronóstico de series de tiempo basado en LSTM, y este modelo pudo predecir con precisión las ventas de vehículos ecológicos14.
El desarrollo de políticas requiere comprender el comportamiento de los usuarios y priorizar sus elecciones. Por lo tanto, algunos estudios anteriores utilizaron datos de encuestas para predecir la demanda de vehículos eléctricos. Para evaluar la demanda potencial de vehículos eléctricos, Beggs et al.15 utilizaron datos de encuestas y especificaciones del vehículo, como la capacidad de asientos, la velocidad máxima, el precio de compra y los costos operativos. En un estudio similar, Calfee et al.16 estimaron la demanda de vehículos eléctricos en función de las preferencias de los consumidores por los atributos de los vehículos. Los resultados de esta investigación han demostrado que el bajo rendimiento de los vehículos eléctricos limita su demanda; sin embargo, si los vehículos eléctricos se vuelven significativamente más avanzados que otros automóviles o si la gasolina escasea, la demanda de estos vehículos aumentará.
Predecir la demanda futura de vehículos eléctricos es un tema complejo. Como la mayoría de los estudios de nuevas tecnologías se basan en datos de encuestas, las predicciones de participación de mercado reflejarán la participación en los datos de la encuesta, no la participación de mercado real. Las opiniones de los consumidores y las noticias que se publican sobre los VE también influyen en las ventas de estos vehículos. Según la investigación de Mau et al.17, las ventas de vehículos eléctricos se ven afectadas por la información publicada sobre la tasa de penetración de los vehículos eléctricos, conocida como "el efecto vecino". Las especificaciones de los vehículos eléctricos son otro factor que afecta sus ventas. Según el estudio de Balducci et al.18 para evaluar los escenarios de penetración de los vehículos eléctricos híbridos enchufables en el mercado automotriz, el ahorro de combustible y la reducción de las emisiones de los vehículos motorizados son los factores más importantes al comprar vehículos eléctricos híbridos, mientras que la potencia del motor insuficiente, el alto precio y la falta de confiabilidad son factores importantes. las razones más importantes para no comprar estos vehículos. Además, Hess et al. especificaciones de vehículos usados, como precio de compra, incentivos de compra de vehículos, millas por galón (MPG) o equivalente, costo de combustible por año, disponibilidad de combustible, tiempo de reabastecimiento de combustible, rango de manejo, costo de mantenimiento por año y aceleración para explorar las preferencias de los consumidores al elegir el tipo de vehículo y el tipo de combustible. Los resultados han demostrado que las elecciones de los consumidores se ven afectadas negativamente por factores como el precio de compra, el costo operativo y la antigüedad del vehículo, mientras que sus elecciones se ven afectadas positivamente por factores como una mejor aceleración del vehículo, incentivos de compra, rango de conducción y disponibilidad de combustible19.
La venta de vehículos eléctricos también se ve afectada por la mejora del rendimiento del motor del vehículo y la reducción del consumo de combustible. Utilizando un modelo de elección discreta, Bas et al. investigó la penetración de EV frente a la nueva tecnología para reducir el consumo de combustible. Los resultados demostraron que los compradores potenciales perciben una clara compensación entre el costo de un sistema alimentado por gasolina y el ahorro de combustible que proporciona20. Sin embargo, los compradores potenciales de vehículos eléctricos no se encuentran en esta categoría ya que su análisis de costo-beneficio es adverso debido al bajo costo de la electricidad20. Asimismo, las cuotas de mercado estimadas otorgan una porción significativa del mercado a las alternativas que incluyen tecnología para reducir el consumo, debido a una actitud más favorable hacia las tecnologías amigables con el medio ambiente20. Además, Shafiei et al. analizó el impacto de factores como los precios del combustible, los atributos de los vehículos, las preferencias de los consumidores y las influencias sociales en la cuota de mercado de los vehículos eléctricos. Los resultados mostraron que la combinación de precios altos de gasolina, precios decrecientes de EV, reducción de impuestos sobre EV y eliminación de las preocupaciones de los consumidores sobre la recarga tiene el efecto más significativo en la participación de mercado de EV21. La investigación de Kinski et al.22 muestra que la información relacionada con la búsqueda en Internet (Google Trends) de vehículos tiene una relación positiva y significativa con las ventas de automóviles.
Con base en la investigación previa, se llegó a las siguientes dos conclusiones generales:
En primer lugar, se ha demostrado que los métodos ML y DL son efectivos para predecir las ventas de vehículos. Por lo tanto, LSTM y ConvLSTM, poderosos modelos DL, se han utilizado para predecir las ventas de vehículos en esta investigación. Además, también se propuso un modelo híbrido y los tres modelos se compararon en términos de rendimiento.
En segundo lugar, se identificaron los factores y características que afectan las ventas de vehículos eléctricos, y estas características se recopilaron y utilizaron en esta investigación.
La inteligencia artificial (IA) se refiere a la capacidad de las máquinas para percibir, sintetizar e inferir información, a diferencia de los animales y los humanos que muestran inteligencia23. El aprendizaje automático, las redes neuronales artificiales y el aprendizaje profundo son herramientas importantes en el desarrollo de sistemas de IA y se ha demostrado que funcionan bien en la predicción de datos de series temporales, como las ventas de vehículos. Las redes neuronales recurrentes (RNN) son un tipo de red neuronal que recuerdan lo que ya han procesado y pueden aprender de iteraciones anteriores24. En otras palabras, una RNN es una clase de ANN donde las conexiones entre nodos forman un gráfico dirigido a lo largo de una secuencia temporal; esto le permite exhibir un comportamiento dinámico temporal24.
Hochreiter y Schmidhuber introdujeron la red LSTM, una RNN capaz de aprender dependencias a largo plazo y predecir datos secuenciales con gran precisión25. Un LSTM es una extensión de un RNN, capaz de aprender patrones a partir de largas secuencias de datos fuente mediante la retención de una memoria a largo plazo25. Los LSTM mejoraron el olvido de los RNN. Un RNN podría retener una memoria, pero solo para su pasado inmediato. Un LSTM, por otro lado, introduce bucles para generar gradientes a largo plazo. Mientras recorre sus bucles, puede descubrir patrones a largo plazo25. LSTM es bueno para almacenar información pasada y funciona bien cuando se enfrenta a problemas de gradientes que se desvanecen. Durante el entrenamiento de ANN, cada peso de la red neuronal recibe una actualización proporcional a la derivada parcial de la función de error. Los gradientes que se desvanecen ocurren cuando los gradientes se vuelven cada vez más pequeños, evitando efectivamente que el peso cambie26.
LSTM puede unir tres piezas de información en cada paso de tiempo: los datos de entrada actuales, la memoria a corto plazo que recibe de la celda anterior (el estado oculto) y la memoria a largo plazo de las celdas más lejanas (el estado de la celda) 27 La unidad LSTM consta de una puerta de entrada, una puerta de olvido, una puerta de salida y un estado de celda. La puerta de entrada determina cuánta información debe transferirse desde el estado actual de la celda candidata al estado actual de la celda. La puerta de olvido determina cuánta información histórica debe ignorarse del estado de celda anterior. El flujo de salida de las celdas al resto de la red se puede controlar a través de la puerta de salida. Al regular el flujo de información a través de las tres puertas, se puede recordar información importante en intervalos de tiempo. De acuerdo con las Ecs. 1–6, la unidad LSTM procesa datos en estado de celda y puertas27. Reference27 proporciona más detalles.
En las ecuaciones anteriores, \(f_{t}\), \(i_{t}\) y \(o_{t}\) son las puertas de olvido, entrada y salida, respectivamente; \(C_{t}\), \(C_{t - 1}\) y \(\tilde{C}_{t}\) son el estado de celda actual, anterior y candidato; \(\sigma\) y tanh denotan funciones de activación de tangente hiperbólica y sigmoidea, respectivamente; las matrices de peso interconectadas para cada puerta y estado de celda son \(W_{fh}\), \(W_{ih}\), \(W_{oh}\), \(W_{Ch}\), respectivamente; \(W_{fx}\), \(W_{ix}\), \(W_{ox}\), \(W_{Cx}\) representan las matrices de peso de entrada en las tres puertas y el estado de celda, respectivamente ; \(b_{f}\), \(b_{i}\), \(b_{o}\), \(b_{C}\) representan los respectivos términos de sesgo; el producto de Hadamard (producto de elementos) de una matriz se denota por \(\odot\)27. Según la Fig. 1, la capa de entrada es una capa LSTM con el mismo número de neuronas que las características de los datos de entrada. En el siguiente paso, una o más capas LSTM se configuran como capas ocultas y, en el paso final, se configura una capa densa con la función de activación de ReLU como capa de salida.
Arquitectura del modelo LSTM.
El modelo LSTM es poderoso para manejar la correlación temporal. Además, cuando se trabaja con datos de series temporales con numerosas características, el rendimiento del modelo LSTM se puede mejorar convirtiendo los datos bidimensionales en un tensor tridimensional (la Fig. 2 ilustra esto), conectando estados y aplicando operaciones convolucionales; esta idea fue la razón para crear el modelo ConvLSTM28. La red neuronal ConvLSTM es una red LSTM completamente conectada con una estructura convolucional dentro de la celda LSTM, que funciona bien en la predicción de datos con correlación temporal. ConvLSTM proporciona una extensión totalmente conectada para la transferencia de datos entre estados y de entradas a estados28. En otras palabras, ConvLSTM determina el estado futuro de cada celda en la cuadrícula en función de sus entradas y los estados pasados de los vecinos; esto se puede hacer usando un operador de convolución en las transiciones de estado a estado y de entrada a estado28. En el modelo ConvLSTM, los datos en la unidad de entrada, las salidas de cada celda, las unidades ocultas y las puertas se organizan como tensores tridimensionales. ConvLSTM tiene parámetros similares a LSTM, y la diferencia está en cómo se transfieren los datos y cómo se usa la multiplicación convolucional en los cálculos, como se expresa en las ecuaciones. 7-1128. Reference28 proporciona más detalles.
Transformación de matriz 2-D en tensor 3-D.
En las ecuaciones de ConvLSTM, * indica el operador de convolución y \(\odot\) indica el producto de Hadamard. Como se muestra en la Fig. 3, la capa de entrada es una capa ConvLSTM, las capas ocultas son capas Densa y ConvLSTM, y la capa de salida es una capa Densa con la función de activación ReLU.
Arquitectura del modelo ConvLSTM.
Los datos de series de tiempo tienen una relación temporal significativa. En esta investigación, los datos fueron transformados en tensores tridimensionales con una ventana de tiempo de siete meses para mantener la relación temporal; cómo transformar una matriz bidimensional en un tensor tridimensional se muestra en la Fig. 2. Como innovación, se ha propuesto en esta investigación el método de "Atención bidimensional" para determinar la importancia de la característica de cada automóvil en un siete marco de tiempo de un mes y utilizar los datos ponderados en el proceso de modelado. El método de atención bidimensional asigna pesos a cada característica en la ventana de tiempo en función de cuánto influye en el modelo, lo que permite que las características con un impacto más significativo reciban más atención y reduzcan la complejidad del modelo. El modelo de atención unidimensional fue propuesto por primera vez por Bahdanau para abordar el problema del acceso limitado del decodificador a la información de entrada del modelo cuando el vector del codificador tiene una longitud fija en la máquina de traducción29.
En la arquitectura del modelo LSTM, que se muestra en la Fig. 1, se colocan varias capas LSTM dentro de la capa oculta. Cuando aumenta el número de capas LSTM en la capa oculta, las capas primarias (las capas adyacentes a la capa de entrada) tienen un efecto menor en la salida. Las capas primarias han procesado los datos de entrada y han aprendido bien la relación entre los datos, por lo que se ha intentado mejorar este problema utilizando la red Residual en el modelo híbrido propuesto. Usando la Red Residual, los datos ponderados y las salidas de las capas primarias se han transferido a las capas finales en el modelo híbrido propuesto, como se muestra en la Fig. 4.
Arquitectura primaria del modelo híbrido.
En este estudio, cada entrada \(x\) está representada por una matriz \(m \times n\), donde m corresponde a los meses anteriores en la ventana (7), y n representa el número de características del vehículo. Después de ingresar los datos en la primera capa LSTM, el procesamiento se realiza de acuerdo con las ecuaciones. 1–6, y la unidad oculta codificada (\(h\)) con las dimensiones exactas (\(m \times n\)) se ingresa en la capa Atención. Después de eso, la puntuación de alineación se calcula de acuerdo con la ecuación. (12).
En la ecuación. (12), \(e_{i, j}\) representa la puntuación de alineación, \(W_{a}\) es el peso del modelo de atención (como una variable entrenable), \(h\) es la unidad oculta codificada de la capa LSTM primaria, \(b_{a}\) es el sesgo del modelo de atención (como una variable entrenable), y el signo "*" denota el producto de Hadamard. Dado que los datos de entrada para la capa de atención han sido codificados por una capa LSTM usando la función de activación no lineal tanh, también se ha utilizado tanh en la capa de atención para facilitar la lectura de datos durante la decodificación. A cada elemento de datos de entrada se le asignó un grado de atención utilizando la ecuación. (13).
Al multiplicar la matriz de atención \(\alpha_{i, j}\) por la matriz de datos sin procesar \(x_{i, j}\) se obtiene una matriz de datos ponderada \(W_{i, j}\) basada en la ecuación. (14). El signo "*" denota el producto Hadamard.
Los datos ponderados \(W_{i, j}\) luego pasan a través de tres capas de LSTM como una red residual; la salida de cada capa se combina con los datos ponderados al final de la red residual y se ingresa en una o más capas LSTM. Una capa densa con la función de activación de ReLU es la capa de salida. En la Fig. 4 se ilustra una descripción general de la arquitectura del modelo.
También se han probado otras arquitecturas en la estructura del modelo híbrido, pero no resultaron más eficientes, por lo que solo se ha mencionado la mejor arquitectura.
En este estudio, los vehículos eléctricos se consideran vehículos que utilizan motores eléctricos para la propulsión e incluyen todos los tipos de vehículos eléctricos. En la predicción de la venta de vehículos, el número de vehículos en las bodegas es un factor influyente, el cual no fue utilizado en esta modelación por falta de acceso. Dado que los modelos ML se basan en la capacitación, en este estudio, los modelos pueden predecir las ventas de vehículos que han estado en el mercado durante al menos 24 meses. Los vehículos emergentes (vehículos que han estado en el mercado por menos de 24 meses) y los automóviles que aún no han ingresado al mercado no se incluyeron en el modelado debido a datos insuficientes para entrenar el modelo. Por lo tanto, la participación de los vehículos eléctricos en el mercado automotriz se expresa como una participación en los segmentos de vehículos y no como una participación de los vehículos eléctricos en general.
En esta investigación se ha utilizado una amplia gama de información relacionada con las ventas de automóviles. En el conjunto de datos principal, todos los datos están relacionados con autos nuevos, no con autos usados. El conjunto de datos principal contiene información mensual sobre 357 vehículos, como marca (o "marca" en la jerga de la industria automotriz, por ejemplo, Benz), modelo, segmentación, categoría, compradores y ventas de diferentes tipos de automóviles en los Estados Unidos desde 2014 hasta 2020. Se extrajo otra información basada en los autos en este conjunto de datos. Se utilizaron los datos anteriores al brote de la enfermedad de Covid-19, ya que esta enfermedad tuvo un impacto adverso en la economía mundial.
Como se indicó en estudios anteriores, las especificaciones de los vehículos son muy efectivas en los modelos de predicción de ventas de automóviles. Las especificaciones del vehículo se cambian anualmente. De acuerdo con la calificación de Alexa30 y la exhaustividad de la información presentada en el sitio web "Thecarconnection"31, las especificaciones de los vehículos se recopilaron a través de este sitio web. Con el fin de ahorrar tiempo y automatizar la recopilación de información debido a una gran cantidad de vehículos y cambios en las especificaciones de los vehículos a lo largo del tiempo, se han diseñado y utilizado varios rastreadores web en el lenguaje de programación Python para recopilar información del vehículo. Varias especificaciones de vehículos del segmento "AUTO-MID/FULL SIZE" se muestran en la Tabla 1.
Hay información similar recopilada para gasolina y vehículos eléctricos; por ejemplo, el MPG equivalente en vehículos eléctricos. Precio, MPG, kilometraje máximo, potencia del motor y garantía son algunas de las principales características que se tienen en cuenta. Otras especificaciones se han dividido en las categorías de "especificaciones de seguridad" y "otras especificaciones". La categoría de especificaciones de seguridad incluye cerraduras de seguridad para niños en las puertas traseras, bolsas de aire, frenos ABS, luces de circulación diurna, visión nocturna, alertas de monitoreo del conductor, sistema de frenado de mitigación de colisiones, control electrónico de estabilidad y vigas de impacto lateral. Todas las demás características (control de tracción, faros antiniebla, monitoreo de la presión de los neumáticos, sensores de estacionamiento, asistencia de estacionamiento y cámaras de respaldo) se transfirieron a la categoría de otras especificaciones.
La segunda serie de datos recopilados se refiere a las opiniones de los usuarios y las noticias publicadas en sitios web de buena reputación clasificados más alto en Alexa30. Se examinaron cuatro sitios web para este fin: Autoblog32, Auto News33, Motor134 y The Car Connection35. Estos sitios web se rastrearon utilizando rastreadores web de Python para ahorrar tiempo y recopilar información automáticamente. De 2014 a 2020 se recopilaron y evaluaron las noticias diarias publicadas para cada tipo de vehículo. Se utilizó el método Valence Aware Dictionary and sEntiment Reasoner (VADER) para el análisis de sentimientos del texto. Basado en el análisis de vocabulario, el método de análisis de sentimiento VADER analiza correctamente el sentimiento expresado en las redes sociales y los textos de noticias. Diez calificadores humanos independientes analizaron más de 90 000 calificaciones en la evaluación VADER, lo que condujo a la adopción de 7500 características lingüísticas que se calificaron en función de sus puntajes de valencia, que indican la intensidad y la polaridad del sentimiento36. Para cada vehículo se ha calculado la nota media mensual de noticias y opiniones en función de su publicación diaria de las mismas.
Otra fuente efectiva de información sobre el mercado de vehículos son varios indicadores económicos. Utilizando un rastreador web de Python, se ha recopilado información sobre varios indicadores económicos que afectan al mercado de automóviles en el sitio web de la Reserva Federal37. Los indicadores económicos incluyen el PIB, el índice de precios al consumidor (IPC), el índice de precios al productor, el índice de confianza del consumidor, el ingreso personal per cápita, las tasas de interés de los préstamos a 48 y 60 meses, SP&500 e indicadores bursátiles Dow Jones.
Según la investigación de Kinski, usar las tendencias de Google en los modelos de predicción es beneficioso y práctico22. Se han seleccionado tres palabras clave para los datos de tendencia de Google para evaluar la cantidad de búsquedas de cada automóvil desde 2014 hasta 2020 y para los Estados Unidos de América. Las palabras clave son:
"Marca" + "Modelo"
"Precio" + "Marca" + "Modelo"
"Distribuidor" + "Marca"
Todos los automóviles tienen los mismos datos recopilados, y las características recopiladas mensualmente para cada automóvil se enumeran en la Tabla 2. Varias versiones diferentes estaban disponibles en el mercado para algunos vehículos simultáneamente, y algunas características, como el precio y MPG, tenían múltiples. valores de estos vehículos. Debido a esto, los valores recolectados para estas características se dividieron en tres categorías: mínimo, promedio y máximo.
La función de ventas se ha normalizado en función de los valores máximos y mínimos del conjunto de datos de entrenamiento. Otras funciones están estandarizadas en función del promedio y la desviación estándar de cada función en el conjunto de entrenamiento. Los datos de entrada a los modelos se consideran ventanas de siete meses para mantener la correlación temporal. Por ejemplo, en el mes actual, los datos de los últimos siete meses se ingresan (X) y la venta del mes actual se genera (Y). Para lograr esto, las matrices de datos de siete meses se colocaron consecutivamente en la tercera dimensión de un tensor tridimensional.
Dado que los datos de la serie temporal en este estudio son mensuales, se agregaron once columnas binarias al conjunto de datos para reflejar el efecto de cada mes (en el primer mes de cada año, la columna correspondiente al primer mes se establece en 1 y la columna para los otros meses se establece en 0). Un ejemplo de estos datos binarios se muestra en la Tabla 3.
Para la mayoría de los vehículos, los datos incluyen 79 meses (de enero de 2014 a julio de 2020). De acuerdo con la Fig. 5, los últimos 14 meses se seleccionan para el conjunto de pruebas como validación cruzada continua. El uso de la validación cruzada de forma continua es una forma de validar el modelo de serie temporal. Comenzando con un subconjunto de datos para entrenamiento, pronosticando para puntos de datos posteriores y luego verificando la precisión de los pronósticos. Los mismos puntos de datos pronosticados se incluyen en el siguiente conjunto de datos de entrenamiento y se realizan más pronósticos.
Dividir el conjunto de datos en conjuntos de entrenamiento, validación y prueba.
El modelo se valida de forma cruzada utilizando 12 etapas de pronóstico, y cada etapa predice las ventas en los próximos tres meses. Durante cada etapa de predicción, los meses anteriores se dividen en capacitación y validación (70% para capacitación y 30% para validación). Luego, estos datos se transfieren al modelo, el modelo predice las ventas en los próximos tres meses, luego se mueve la fecha de pronóstico. adelante por un mes, y este proceso se ha repetido 12 veces. Las ventas de vehículos en los próximos tres meses se pronostican cada vez que se ejecuta el modelo, asumiendo que la mayoría de las características del vehículo siguen siendo las mismas. Debido a la fluctuación y los cambios en las condiciones económicas, un El horizonte temporal de un mes se utiliza para predecir el futuro.
El overfitting es uno de los principales problemas en el entrenamiento de ANN. Las capas Dropout entre las capas de la red neuronal son una de las mejores soluciones en la ANN para evitar el sobreajuste. Durante la capa de abandono, el número de neuronas entrenadas en cada capa y las descartadas se determina aleatoriamente (en lugar de activar todas las neuronas a la vez, solo se activa una fracción)38. La herramienta de detención anticipada de TensorFlow es otra solución básica para evitar el sobreajuste. La detención anticipada funciona de la siguiente manera: durante la repetición del entrenamiento, los datos de validación se utilizan para calcular el valor del error, y cada vez que el valor del error de validación aumenta a lo largo de varias épocas, el modelo está listo para detenerse y se evita el sobreajuste. Para los tres modelos, ambas soluciones se utilizan para evitar el sobreajuste. La reducción de la dimensionalidad es otra forma de evitar el sobreajuste del modelo. En este estudio, el Análisis de Componentes Principales se utilizó en varios modos para reducir las dimensiones, pero esta técnica no se utilizó debido a la disminución significativa en el rendimiento del modelo.
Para mejorar el proceso de modelado, los valores de los hiperparámetros y las arquitecturas de red de los tres modelos se determinaron mediante el aprendizaje automático automático (AutoML). AutoML es el proceso de automatización de aplicaciones ML. Los sintonizadores determinaron el número de capas ocultas, el número de neuronas en estas capas y la tasa de abandono. Se introducen varios valores en el sintonizador para cada hiperparámetro. El sintonizador entrena diferentes versiones del modelo y selecciona la mejor en función del mejor resultado (menor error o pérdida) en los datos de validación. Este método establece los hiperparámetros en el valor óptimo y luego el modelo se aplica a un conjunto de datos de prueba.
El error o la pérdida del modelo se calcula utilizando la función de pérdida del error absoluto medio (MAE) en los tres modelos. Seleccionar un algoritmo de optimización adecuado para el modelo DL es esencial para reducir el tiempo de ejecución y alcanzar el resultado deseado. El algoritmo de optimización de Adam se utiliza para estos modelos, que es una versión generalizada del descenso de gradiente estocástico. Reduce el uso de la memoria, converge más rápido y corrige la alta variación y las tasas de aprendizaje39.
Con los datos de validación, se ajustan los hiperparámetros y se construye el modelo para predecir las ventas de vehículos durante los próximos tres meses (tres meses después de la última fecha de validación). El tiempo de ejecución del modelo para todos los vehículos fue muy largo debido a la gran cantidad de tipos de vehículos (357). En una muestra aleatoria de 15 vehículos, se compararon los estados de diferentes modelos utilizando datos fijos y los resultados se compararon entre los tres modelos.
La venta de cada vehículo está prevista en 12 etapas; cada etapa de predicción incluye la predicción para los siguientes tres meses, respectivamente, el primer mes de la predicción, el segundo mes de la predicción y el tercer mes de la predicción. En total, las primeras predicciones incluyen 12 meses, las segundas predicciones incluyen 12 meses y las terceras predicciones incluyen 12 meses. El rendimiento del modelo se evaluó utilizando el error porcentual absoluto medio (MAPE), el error cuadrático medio normalizado por el rango de cambio (\(NRSME_{rango}\)) y el error cuadrático medio normalizado por el valor medio (\(NRSME_ {media}\)) según las Ecs. 15–18.
De acuerdo con las ecuaciones anteriores, \(y_{t}\) denota el valor real en el momento t, \(\hat{y}_{t}\) denota el valor predicho en el momento t, \(y_{max}\ ) denota el valor real máximo, \(y_{min}\) denota el valor real mínimo, \(y_{mean}\) denota el valor real promedio y T es igual al número total de muestras previstas. Los valores de error promedio de todos los vehículos se calcularon para comparar los resultados de varios modelos. Se calculó un promedio ponderado utilizando el número total de ventas de cada automóvil por mes como peso para el vehículo de acuerdo con la Ec. (19) ya que los números de ventas de vehículos no están en la misma escala, y la tasa de error es más importante en los vehículos con ventas altas. Otro método para comprobar el rendimiento de los modelos es comparar el R-cuadrado, la pendiente y la intersección de las regresiones lineales ajustadas a los datos previstos y observados para los tres modelos. La Tabla 4 resume los resultados de la evaluación de los modelos.
En el modelo híbrido propuesto, los valores de error son más bajos, la precisión de R-cuadrado es más alta, el valor de la pendiente está más cerca de 1 y la intersección está más cerca de 0. En esta etapa, el modelo híbrido propuesto se reconoció como preferible a ambos. los modelos LSTM y ConvLSTM.
Para todos los vehículos se ha implementado el modelo híbrido propuesto y se han utilizado 12 puntos de predicción para determinar la venta de todos los vehículos. Se ajustó la regresión lineal a las ventas pronosticadas y los valores reales para evaluar el desempeño del modelo, como se muestra en la Tabla 5.
Los datos primarios segmentan los vehículos por especificaciones según segmentos como COCHE-PEQUEÑO_COMPACTO, COCHE-MEDIANO_TAMAÑO COMPLETO, MINIVAN GRANDE y PICKUP LARGE. Cada segmento consta de vehículos similares en apariencia y especificaciones que compiten entre sí. Los segmentos que incluyen vehículos eléctricos se han separado para determinar la proporción de vehículos eléctricos. Con base en las ventas reales y previstas, se compararon y evaluaron las participaciones de vehículos eléctricos y de gasolina para cada mes de los datos de prueba. Por ejemplo, el segmento CAR-MID/FULL-SIZE incluye 28 vehículos (23 vehículos de gasolina y cinco EV). La Figura 6 muestra la proporción de vehículos eléctricos en este segmento en base a doce etapas de predicción (tres meses por etapa), por separado para el primer, segundo y tercer mes de cada predicción.
(a) Porcentaje de vehículos eléctricos en CAR-MID/FULL-SIZE según el primer mes de cada predicción. (b). Porcentaje de vehículos eléctricos en CAR-MID/FULL-SIZE según el segundo mes de cada predicción. (c) Porcentaje de vehículos eléctricos en CAR-MID/FULL-SIZE según el tercer mes de cada predicción.
El MAE de todos los segmentos para el pronóstico de participación de vehículos eléctricos en el primer, segundo y tercer mes del pronóstico se muestra en la Tabla 6. El valor MAE promedio de todos los segmentos se calculó como 3.2% para los primeros meses, 3.8% para los segundos meses y 3,5% para los terceros meses. El valor promedio para todos los segmentos y todos los meses de pronóstico se calculó en alrededor del 3,5 %, lo que demuestra que el modelo híbrido propuesto funcionó bien.
Como parte del análisis del modelo, los segmentos que incluían vehículos eléctricos se separaron nuevamente y se clasificaron según las ventas dentro de cada segmento. Las clasificaciones se basaron en las ventas reales (clasificación real) y las ventas previstas (clasificación prevista); el rango real y el rango predicho se usaron para la evaluación. La correlación de Kendall-Tau (correlación de Kendall) se usa comúnmente para verificar la concordancia de dos listas clasificadas; esta técnica se utilizó para examinar las clasificaciones reales y previstas en este estudio. La tasa de correlación de Kendall para dos listas de calificación \(r_{a}\) y \(r_{b}\) (\(\tau_{{r_{a} , r_{b} }}\)) está representada por la ecuación. (20) 40.
En la ecuación. (20), \(n_{c}\) representa el número de pares concordantes, \(n_{d}\) representa el número de pares discordantes y n representa el número total de rangos en cada una de las listas de calificación40. El número máximo de pares discordantes entre dos listas de clasificación es igual a \(\frac{1}{2} n\left( {n - 1} \right)\), y la correlación de Kendall es igual a + 1 si todos los pares de clasificaciones son concordantes y -1 si ninguno es concordante 40. Para todos los segmentos, los valores de correlación de Kendall se calcularon por separado para el primer, segundo y tercer mes de predicción, y los valores promedio se muestran en la Tabla 7. El valor de correlación de Kendall promedio de todos los segmentos se calculó como 0,76 para los primeros meses, 0,742 para los segundos meses y 0,75 para los terceros meses. El valor promedio de la correlación de Kendall para todos los segmentos y todos los meses de pronóstico se calculó en alrededor de 0,75, lo que indica el gran rendimiento del modelo híbrido propuesto para predecir la clasificación.
Se realizó un análisis de sensibilidad para determinar qué características impactaron significativamente en el modelo entrenado. Así, para cada vehículo, el modelo preentrenado que se evaluó en etapas anteriores ha vuelto a predecir el número de ventas de vehículos con nuevos datos de entrada y se han evaluado sus salidas. Todas las características, excepto la característica investigada, se valoran en su promedio. Para la función investigada, se tienen en cuenta los cinco valores de los datos de entrenamiento (el valor mínimo, el primer cuartil, el segundo cuartil, el tercer cuartil y el valor máximo). Se hicieron cinco predicciones basadas en estos cinco valores y se calculó un rango de cambios en las ventas pronosticadas. Se midieron los rangos de cambio para todas las características y se identificaron las cuatro características con el rango más extenso. Por ejemplo, durante el análisis de sensibilidad del BMW I3 para 2020, las siguientes cuatro características tuvieron la gama más amplia de cambios: el índice de precios al consumidor (IPC), el MPG equivalente para vehículos eléctricos, el puntaje de búsqueda de Google para precios de automóviles (Google Trends ), y el precio del coche. Los gráficos de análisis de sensibilidad de este EV se muestran en la Fig. 7.
( a ) Gráfica de análisis de sensibilidad de la característica influyente 1 para BMW I3. (b) Gráfica de análisis de sensibilidad de la característica influyente 2 para BMW I3. ( c ) Gráfica de análisis de sensibilidad de la característica influyente 3 para BMW I3. ( d ) Gráfica de análisis de sensibilidad de la característica influyente 4 para BMW I3.
Basado en la Ec. (21), los valores de pendiente para las cuatro características con el rango de cambios más extenso se calculan en diferentes partes del gráfico, y los resultados se resumen en la Tabla 8. Por ejemplo, el número de ventas de este EV ha disminuido en 8 para cada aumento de mil dólares en el precio cuando el precio está en el rango del valor mínimo al primer trimestre. Como la pendiente es cero por ciento en la segunda y tercera parte del gráfico, el precio en el primer, segundo y tercer cuartil es igual, y cuando el precio está en el tercer cuartil al precio máximo, el número de ventas para este EV disminuye en 6 por cada aumento de mil dólares en el precio.
Ha habido una disminución en las ventas de automóviles debido al aumento en el IPC. También es cierto que con la subida del IPC ha aumentado el precio final del coche y el precio de las autopartes, lo que ha hecho que disminuya el deseo de comprar este coche. La segunda característica es el MPG equivalente para EV, un MPG equivalente más alto que indica un mejor rendimiento y un menor consumo de combustible en una distancia fija ha llevado a un aumento en las ventas de este automóvil. La tercera característica identificada es el aumento en el puntaje de búsqueda de precios de automóviles en Google (Google Trend), un indicador de que los compradores tienen más curiosidad por este automóvil, lo que contribuye a sus ventas. La cuarta característica especificada del automóvil es su precio, y sus ventas han disminuido con el aumento de su precio. Como resultado del análisis de sensibilidad, los fabricantes de este automóvil podrían usar políticas como reducir el precio del automóvil y sus partes (IPC y precio del automóvil), mejorar el rendimiento del motor del vehículo (MPG equivalente) y desarrollar anuncios y presentar el automóvil al público (puntuación de tendencias de Google) para aumentar las ventas.
Se realizó un análisis de sensibilidad para cada vehículo eléctrico y los resultados muestran una sensibilidad diferente para cada vehículo. De cada segmento que incluye vehículos eléctricos, se seleccionó un vehículo como muestra y los resultados de su análisis de sensibilidad se muestran en la Tabla 9.
El análisis de sensibilidad de cada EV identifica características que difieren de los demás, como se muestra en la Tabla 9. De acuerdo con los resultados del análisis de sensibilidad, se identificaron diez características que se encontraron con mayor frecuencia en el análisis de sensibilidad de todos los EV como las características más influyentes: Compradores, Precio mínimo, CPI, Ventas, Puntaje de Google Trends 3 (Precio), Puntaje de noticias de marca y modelo, Ingreso personal per cápita, Puntaje de noticias de marca, Tasas de interés en 60 meses y Puntaje de opciones promedio, respectivamente.
Este estudio aborda un tema importante desde una perspectiva empresarial. Los fabricantes de automóviles pueden beneficiarse de esta investigación al comprender su cuota de mercado y el efecto de los precios y las especificaciones del vehículo en la cuota de mercado. Pueden usar los resultados de este estudio para analizar tanto su mercado EV como su mercado Non-EV. Más abajo en el embudo, los concesionarios de automóviles que operan en un entorno altamente competitivo pueden crear estrategias para sus eventos de ventas, campañas de marketing y descuentos para cumplir con sus objetivos comerciales y objetivos de ventas. Finalmente, el modelo permite al sector público comprender el efecto de las políticas fiscales sobre la participación de vehículos EV en caso de que deseen promoverlos.
Este estudio utilizó métodos ML para desarrollar un modelo de predicción que estimó la venta de todos los automóviles en el conjunto de datos, la participación de EV en cada segmento e identificó los principales factores que afectan las ventas de cada EV. En esta investigación, se han utilizado varios rastreadores web para recopilar diversos datos, incluidos factores que estudios anteriores han demostrado que están asociados con las ventas de vehículos eléctricos. La venta de vehículos se predijo utilizando LSTM, ConvLSTM y el modelo híbrido propuesto (Hybrid LSTM con red bidimensional de Atención y Residual). Se han utilizado varias herramientas de ML para mejorar el entrenamiento del modelo y el proceso de modelado, como la transformación de datos de series temporales bidimensionales en tensores tridimensionales, capas de deserción, herramientas de detención anticipada y AutoML. Debido a la variedad de tipos de autos y el largo tiempo de funcionamiento de los modelos, se hizo una selección aleatoria de quince tipos de autos. Los tres modelos se evalúan en función de las mismas unidades de evaluación: MAPE, NRSME_rango y NRSME_media, R-cuadrado, pendiente e intersección de regresiones lineales ajustadas también se evaluaron. Los valores de error promedio en los tres meses de predicción fueron los siguientes:
El valor MAPE del modelo híbrido propuesto fue 4,5 % menor que el modelo LSTM y 14,4 % menor que el modelo ConvLSTM.
El valor NRSME_range del modelo híbrido fue 0,11 menos que el modelo LSTM y 0,22 menos que el modelo ConvLSTM.
El valor NRSME_mean del modelo híbrido fue 0,079 menor que el modelo LSTM y 0,169 menor que el modelo ConvLSTM.
Como resultado de ajustar regresiones lineales a los valores pronosticados y reales, para los tres meses de predicciones, el modelo híbrido propuesto tiene un valor de R-cuadrado más alto, su pendiente está más cerca de uno y su intersección está más cerca de cero, lo que indica que el modelo híbrido funcionó mejor que los otros dos. Al comparar los modelos, se encontró que el modelo híbrido propuesto se comportó mejor que otros modelos y fue seleccionado para predecir la venta de todos los vehículos en el conjunto de datos. Según la regresión lineal ajustada a las ventas pronosticadas y las ventas reales de todos los vehículos, los valores R-cuadrado para el primer, segundo y tercer mes de predicción fueron 0,912, 0,906 y 0,917.
Las ventas previstas de todos los vehículos se utilizaron para calcular la proporción prevista de vehículos eléctricos en cada segmento y compararlos con los valores reales. En todos los segmentos y meses de pronóstico, el valor promedio de MAE para la participación de vehículos eléctricos es de aproximadamente 3,5 %, y el modelo híbrido predijo con precisión la participación de vehículos eléctricos en todos los segmentos. Para analizar más a fondo los resultados del modelo, los coches se clasificaron según el número de ventas reales y previstas dentro de cada segmento. El valor promedio de la correlación de Kendall para todos los segmentos y todos los meses de pronóstico se calculó en alrededor de 0,75, lo que indica el alto rendimiento del modelo híbrido propuesto para predecir la clasificación.
El análisis de sensibilidad se realizó para evaluar más a fondo el modelo e identificar sus características más influyentes. Los resultados han demostrado que el análisis de sensibilidad de cada EV identifica características que difieren de los demás. Según el análisis de sensibilidad del BMW I3 para 2020, las siguientes cuatro características fueron las más afectadas: el índice de precios al consumidor, el MPG equivalente para vehículos eléctricos, el puntaje de búsqueda de Google y el precio del automóvil. Como resultado del análisis de sensibilidad, los fabricantes de este automóvil podrían usar políticas como bajar el precio del automóvil y sus partes, mejorar el rendimiento del motor, desarrollar anuncios y presentar mejor el automóvil para aumentar las ventas (consulte las Tablas del Apéndice A1 a A4.2, figura A1).
Esta investigación ha logrado los siguientes logros:
Se ha recopilado y utilizado una amplia variedad de factores como variables para modelar la venta de vehículos eléctricos.
LSTM y ConvLSTM, potentes modelos DL, se han utilizado para predecir las ventas de vehículos. Al combinar el modelo de atención bidimensional y la red residual, se mejoró el rendimiento del modelo LSTM y el innovador modelo híbrido funcionó mejor que los otros dos.
Los vehículos eléctricos difieren en términos de los factores más influyentes para las ventas según los resultados del análisis de sensibilidad. Las diez características que más aparecieron en el análisis de sensibilidad de todos los vehículos eléctricos se identificaron como las más influyentes, incluidos los compradores, el precio mínimo, el CPI, las ventas, la puntuación 3 de Google Trends (precio), la puntuación de noticias por marca y modelo, el ingreso personal per cápita , puntaje de noticias para marca, tasas de interés a 60 meses y puntaje de opciones promedio, respectivamente.
El conjunto de datos principal se tomó de Autometrics y otros datos se recopilaron mediante rastreadores web. Los datos están disponibles del autor correspondiente a petición razonable.
https://www.epa.gov/ghgemissions/inventory-us-greenhouse-gas-emissions-and-sinks (2020).
MacInnis, B. & Krosnick, J. Climate Insights 2020: Vehículos eléctricos. (2020).
https://theicct.org/the-rise-of-electric-vehicles-the-second-million/ (2020).
https://www.iea.org/fuels-and-technologies/electric-vehicles (2022).
Brühl, B., Hülsmann, M., Borscheid, D., Friedrich, CM & Reith, D. en Conferencia industrial sobre minería de datos. 146-160 (caballeros).
Wang, F.-K., Chang, K.-K. y Tzeng, C.-W. Uso de un sistema de inferencia difuso basado en redes adaptativas para pronosticar las ventas de automóviles. Sistema experto aplicación 38, 10587–10593 (2011).
Artículo Google Académico
Hülsmann, M., Borscheid, D., Friedrich, CM & Reith, D. Modelos generales de pronóstico de ventas para mercados automotrices y su análisis. Trans. Mach. Aprender. Datos mín. 5, 65–86 (2012).
Google Académico
Kitapcı, O., Özekicioğlu, H., Kaynar, O. & Taştan, S. El efecto de las políticas económicas aplicadas en Turquía a la venta de automóviles: regresión múltiple y análisis de redes neuronales. Procedia Soc. Comportamiento ciencia 148, 653–661 (2014).
Artículo Google Académico
Bas, J., Zou, Z. & Cirillo, C. Un enfoque de aprendizaje automático interpretable para comprender los impactos de los factores de actitud y de abastecimiento de viajes en la adopción de vehículos eléctricos. transporte Letón. 15, 30–41 (2023).
Artículo Google Académico
Zhang, Y., Zhong, M., Geng, N. y Jiang, Y. Pronóstico de ventas de vehículos eléctricos con modelos de series temporales univariantes y multivariantes: el caso de China. PLoS ONE 12, e0176729 (2017).
Artículo PubMed PubMed Central Google Académico
Kaya, SK y Yıldırım, Ö. Un modelo de predicción para las ventas de automóviles en Turquía utilizando redes neuronales profundas. Ingeniería Industrial 31, 57–74 (2020).
Google Académico
Xia, Z. et al. ForeXGBoost: predicción de ventas de automóviles de pasajeros basada en XGBoost. Distribuir Bases de datos paralelas 38, 713–738 (2020).
Artículo Google Académico
Bas, J., Cirillo, C. & Cherchi, E. Clasificación de compradores potenciales de vehículos eléctricos: un enfoque de aprendizaje automático. Tecnología Pronóstico. Soc. Chang. 168, 120759 (2021).
Artículo Google Académico
Saxena, P., Bahad, P. y Kamal, R. Modelo basado en RNN de memoria a largo plazo a corto plazo para la previsión multivariante de ventas de automóviles. En t. j adv. ciencia Tecnología 29, 4645–4656 (2020).
Google Académico
Beggs, S., Cardell, S. & Hausman, J. Evaluación de la demanda potencial de automóviles eléctricos. J. Economía. 17, 1–19 (1981).
Artículo Google Académico
Calfee, JE Estimación de la demanda de automóviles eléctricos utilizando un análisis de elección probabilística completamente desagregado. transporte Res. Método Parte B. 19, 287–301 (1985).
Artículo Google Académico
Mau, P., Eyzaguirre, J., Jaccard, M., Collins-Dodd, C. & Tiedemann, K. El 'efecto vecino': simulación de la dinámica en las preferencias del consumidor por nuevas tecnologías de vehículos. Ecol. economía 68, 504–516 (2008).
Artículo Google Académico
Balducci, PJ Escenarios de penetración de vehículos eléctricos híbridos enchufables. (Laboratorio Nacional del Noroeste del Pacífico (PNNL), Richland, WA (Estados Unidos) (2008).
Hess, S., Fowler, M., Adler, T. y Bahreinian, A. Un modelo conjunto para la elección del tipo de vehículo y tipo de combustible: Evidencia de un estudio logit anidado cruzado. Transporte 39, 593–625 (2012).
Artículo Google Académico
Bas, J., Zofío, JL, Cirillo, C., Chen, H. & Rakha, HA Implicaciones políticas e industriales de la posible penetración en el mercado de vehículos eléctricos con control de crucero adaptativo eco-cooperativo. transporte Res. Práctica de la política de la Parte A. 164, 242–256 (2022).
Artículo Google Académico
Shafiei, E. et al. Un enfoque de modelado basado en agentes para predecir la evolución de la cuota de mercado de los vehículos eléctricos: un estudio de caso de Islandia. Tecnología Pronóstico. Soc. Chang. 79, 1638–1653 (2012).
Artículo Google Académico
Kinski, A. Tendencias de Google como herramienta complementaria para el pronóstico de ventas de autos nuevos: una comparación entre países a lo largo del viaje del cliente, Universidad de Twente, (2016).
https://en.wikipedia.org/wiki/Inteligencia_artificial (2023).
https://en.wikipedia.org/wiki/Recurrent_neural_network (2023).
Hochreiter, S. & Schmidhuber, J. Memoria larga a corto plazo. Cómputo neuronal. 9, 1735-1780 (1997).
Artículo CAS PubMed Google Académico
Basodi, S., Ji, C., Zhang, H. y Pan, Y. Amplificación de gradiente: una forma eficiente de entrenar redes neuronales profundas. Mín. de datos grandes Anal. 3, 196–207 (2020).
Artículo Google Académico
Wei, X., Zhang, L., Yang, H.-Q., Zhang, L. y Yao, Y.-P. Aprendizaje automático para la predicción de series temporales de presión de agua intersticial: aplicación de redes neuronales recurrentes. Geosci. Frente. 12, 453–467 (2021).
Artículo ANUNCIOS Google Académico
Shi, X. et al. Red LSTM convolucional: un enfoque de aprendizaje automático para el pronóstico inmediato de precipitaciones. Avances en los sistemas de procesamiento de información neuronal 28 (2015).
Bahdanau, D., Cho, K. & Bengio, Y. Traducción automática neuronal mediante el aprendizaje conjunto para alinear y traducir. preimpresión de arXiv arXiv:1409.0473 (2014).
https://www.alexa.com/ (2021).
https://www.thecarconnection.com/ (2021).
https://www.autoblog.com/news/ (2021).
https://www.autonews.com/news (2021).
https://www.motor1.com/news/ (2021).
https://www.thecarconnection.com/news (2021).
Hutto, C. & Gilbert, E. en Actas de la conferencia internacional AAAI sobre web y redes sociales. 216–225.
https://fred.stlouisfed.org/ (2021).
Baldi, P. & Sadowski, PJ Comprender la deserción. Avances en los sistemas de procesamiento de información neuronal 26 (2013).
Kingma, DP y Ba, J. Adam. Un método para la optimización estocástica. preimpresión de arXiv arXiv: 1412.6980 (2014).
Bachrach, Y., Herbrich, R. & Porat, E. en Simposio internacional sobre procesamiento de cadenas y recuperación de información. 344–352 (Springer).
Descargar referencias
Los autores no recibieron apoyo financiero para la investigación, autoría y/o publicación de este artículo.
Departamento de Transporte, Escuela de Ingeniería Civil, Universidad de Ciencia y Tecnología de Irán, Teherán, Irán
Shahriar Afandizadeh y Diyako Sharifi
AECOM, Glen Allen, VA, USA
Navid Kalantari
Departamento de Planificación del Transporte Civil, Facultad de Técnica e Ingeniería, Universidad Internacional Imam Khomeini, Qazvin, Irán
Hamid Mirzahossein
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
Los autores confirman la contribución al artículo de la siguiente manera: concepción y diseño del estudio: SA, DS, NK, HM; recopilación de datos: NK, DS; análisis e interpretación de resultados: SA, DS, NK; preparación del manuscrito: DS, HM Todos los autores revisaron los resultados y aprobaron la versión final del manuscrito. Consentimiento de los autores para la publicación del artículo enviado y cualquier dato asociado e imágenes que lo acompañen
Correspondencia a Shahriar Afandizadeh.
Los autores declaran no tener conflictos de intereses.
Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Afandizadeh, S., Sharifi, D., Kalantari, N. et al. Uso de métodos de aprendizaje automático para predecir la penetración de vehículos eléctricos en el mercado automotriz. Informe científico 13, 8345 (2023). https://doi.org/10.1038/s41598-023-35366-3
Descargar cita
Recibido: 13 noviembre 2022
Aceptado: 17 de mayo de 2023
Publicado: 23 mayo 2023
DOI: https://doi.org/10.1038/s41598-023-35366-3
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.
Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.