Un peligro de la extracción de datos al cual se enfrenta el investigador desprevenido es que los niveles convencionales de significancia (α) tales como 1,5 o 10% no son verdaderos niveles de significancia. Lovell ha sugerido que si hay c candidatos regresores de los cuales k son finalmente seleccionados (k ≤ c) con base en el data-mining, entonces el verdadero nivel de significancia (α*) está relacionado con el nivel de significancia nominal (α) de la siguiente manera.
No hay comentarios.:
Publicar un comentario