Modelo Probabilistico
Desarrollado por Robertson y
Sparck Jones, fue introducido entre 1977 y 1979 y es conocido como modelo
probabilístico o de independencia binaria (BIR). Se fundamenta en la
representación binaria de los documentos, al igual que en el modelo de
recuperación booleano, indicando presencia o ausencia de términos mediante 0 y
1. Su diferencia radica en el método estadístico y en las premisas bajo las que
se constituye su funcionamiento estableciendo las siguientes aseveraciones:
-Según la consulta planteada
por el usuario, los documentos de la colección se clasifican en dos grupos; 1) Conjunto
de Documentos Relevantes y 2) Conjunto de Documentos Irrelevantes.
-Existe una respuesta ideal
del sistema, constituida por el conjunto de documentos relevantes, a la que se
denomina Conjunto de Respuesta Ideal.
-Existe una Consulta
Ideal, que es aquella que proporciona un Conjunto de Respuesta Ideal o lo que
es lo mismo el conjunto de documentos relevantes para el usuario.
-Aunque a priori se
desconoce cuál es la Consulta Ideal (el usuario no tiene porqué conocerla), sí
se sabe que es una combinación de 0 y 1 por ser un modelo binario de
recuperación. Se desconocen por tanto los términos que se deberían introducir
para obtener el Conjunto de Respuesta Ideal.
Modelo
probabilístico o estadístico es la forma que pueden tomar un
conjunto de datos obtenidos de muestreos de datos con comportamiento
que se supone aleatorio.
Un modelo estadístico es un
tipo de modelo matemático que usa la probabilidad, y que incluye
un conjunto de asunciones sobre la generación de algunos datos muéstrales,
de tal manera que asemejen a los datos de una población mayor.
Las asunciones o hipótesis
de un modelo estadístico describen un conjunto de distribuciones de
probabilidad, que son capaces de aproximar de manera adecuada un conjunto de
datos. Las distribuciones de probabilidad inherentes de los modelos
estadísticos son lo que distinguen a los modelos de otros modelos matemáticos
deterministas.
Un modelo estadístico queda
especificada por un conjunto de ecuaciones que relacionan diversas variables,
aleatorias, y en las que pueden aparecer otras variables no aleatrias. Como tal
"un modelo es una representación formal de una teoría”.
Estefany Rodriguez
No hay comentarios:
Publicar un comentario