Random Forests®
Random forests de breiman y cutler
Basado en un conjunto de Árboles de clasificación y regresión (CART®), el motor de modelado Random Forests® suma las predicciones hechas con cada árbol de CART para determinar la predicción general del bosque, al tiempo que garantiza que los árboles de decisión no se vean afectados entre sí.
Para quienes no están familiarizados con Random Forests, se trata de una poderosa técnica de agrupación desarrollada por Leo Breiman y Adele Cutler en la Universidad de California, Berkeley, y es la opción preferida por muchos profesionales del modelado predictivo. La engañosa simplicidad del algoritmo crea cientos de árboles independientes y emplea una gran cantidad de muestras tanto de observaciones como de variables.
La capacidad única de Random Forests de evaluar el rendimiento sin sesgo del modelo en función de los datos “out-of-bag” elimina la necesidad de tener una muestra separada para prueba o validación. Esto coloca inmediatamente a Random Forests como la herramienta de modelado predictivo preferida en las numerosas aplicaciones de datos donde el número de variables supera, frecuentemente por un amplio margen, el número de observaciones disponibles.
Responsabilidad
Random Forests tiene una capacidad única para aprovechar cada registro de su conjunto de datos sin los peligros del sobreajuste. Esto es importante sobre todo para los conjuntos de datos pequeños (en términos de observaciones), donde cada registro puede aportar algo valioso. Random Forests se asegurará de que todos los registros se hayan considerado en sus modelos y que no se haya perdido ni una sola contribución.
Sólida determinación de la importancia de las variables
Random Forests utiliza técnicas novedosas para clasificar los predictores de acuerdo con su importancia. Esto es conveniente cuando los datos incluyen miles, decenas o incluso cientos de miles de variables o predictores, lo que está muy fuera del alcance de las herramientas convencionales de regresión y clasificación. Random Forest puede manejar este tipo de situaciones extremas e informar qué variables utilizar en la investigación de seguimiento. Múltiples rondas de muestreo agregarán robustez y calidad a estos hallazgos.
¿Le interesa probar el motor de modelado
más popular, Random Forests?
Métodos de Minitab basados en árboles
Ya sea que recién esté comenzando o que desee llevar sus capacidades de analítica predictiva al siguiente nivel, los motores de modelado de Minitab basados en árboles le ofrecen la potencia que necesita.
Obtenga más información sobre todas las soluciones de analítica predictiva de Minitab
CART®
El mejor algoritmo de árboles de clasificación que revolucionó la analítica avanzada y dio inicio a la era actual de la ciencia de datos.
Random Forests®
El poder para aprovechar múltiples análisis alternativos, estrategias de aleatorización y aprendizaje con agrupaciones en un único lugar conveniente.
TreeNet®
La herramienta de aprendizaje de máquina más flexible y potente que es capaz de generar de manera consistente modelos extremadamente exactos.