Primero, se dividieron los 200 registros entre
cinco, de manera que cada integrante del
grupo se encargó de realizar 40 registros.
Cada una se enfocó en recaudar información
sobre un distrito diferente a elección para
evitar redundancia.
Luego, dentro de un archivo compartido de Hojas
de cálculo de google, se colocó la tabla que indica
cada variable de investigación.
Después, se buscó cada registro de forma manual.
Para esto, se ingresó a páginas web conocidas de
venta de inmuebles como: [Link],
[Link], [Link], [Link],
entre otras. La información fue recopilada a partir
de la descripción, las fotos y los datos de cada
inmueble.
Seguidamente se colocó la información dentro del
archivo de manera ordenada. Se utilizó una
codificación para las variables cualitativas, en
donde cada respuesta fue intercambiada por un
valor numérico que la represente. De esta manera
evitamos errores futuros al momento del análisis
dentro del programa R.
Por último, se realizó un cuestionario dentro de
Formularios de Google titulado como “El
departamento ideal”. En este cuestionario se
generaron preguntas (para elegir opción y de
respuesta corta) a partir de las variables
recopiladas dentro de la base de datos.
Sesgo de selección: Al recopilar datos únicamente por páginas web,
puede haber un sesgo en los tipos de propiedades y proyectos que se
incluyen en tus datos. Por ejemplo, es posible que no se hayan
considerado propiedades que no se anuncian en línea o proyectos más
pequeños que no se comercializan de la misma manera que los grandes
proyectos. Esto puede llevar a conclusiones erróneas o incompletas al
momento de analizar los datos. Asimismo, es posible que los datos no
sean representativos de todas las propiedades que existen en el mercado
inmobiliario.
Falta de actualización: Es posible que algunos de los datos que se
recopiló estén desactualizados. Las propiedades pueden haberse
vendido o los proyectos pueden haber cambiado desde la última vez
que se publicaron los datos en línea.
Inconsistencia en la calidad de los datos: Es posible que los datos que se
recopilaron no sean consistentes en términos de formato y calidad. Por
ejemplo, algunas propiedades pueden tener información incompleta o
mal escrita, lo que dificulta su comparación y análisis.
Valores atípicos o datos faltantes: Es posible que algunos de los datos
recopilados sean erróneos o que falten valores para algunas variables (Por
ejemplo: Algunos valores tienen como dato “NE” = No especifica).
Sesgo de respuesta: Es posible que algunos propietarios o inmobiliarias
no hayan proporcionado información completa o precisa debido a su
propio sesgo. Por ejemplo, los propietarios o las inmobiliarias
proporcionan información incorrecta sobre las características de una
propiedad, como el número de habitaciones o la presencia de ciertos
servicios como una piscina o un gimnasio. Esto podría afectar la calidad
de los datos y llevar a conclusiones erróneas al momento de analizar los
datos.
Ampliar las fuentes de datos para incluir otras fuentes además de páginas
webs. Por ejemplo, podrías obtener datos de las inmobiliarias
directamente o buscar información en otras fuentes públicas.
Validar la calidad de los datos mediante la revisión manual y el control de
calidad para asegurar de que no haya valores atípicos o datos faltantes.
Utilizar técnicas de análisis estadístico avanzadas para detectar patrones
en los datos y determinar si hay sesgos o inconsistencias. Por ejemplo,
utilizar análisis de regresión para determinar qué variables tienen la
mayor influencia en el precio de la propiedad.
Si se encuentran problemas importantes en los datos, considerar volver a
recopilarlos o encontrar formas de ajustarlos para reducir el impacto de
los problemas identificados.
1. Ampliar las fuentes de datos para incluir otras fuentes además de páginas webs.
Por ejemplo, podrías obtener datos de las inmobiliarias directamente o buscar
información en otras fuentes públicas.
2. Validar la calidad de los datos mediante la revisión manual y el control de calidad
para asegurar de que no haya valores atípicos o datos faltantes.
3. Utilizar técnicas de análisis estadístico avanzadas para detectar patrones en los
datos y determinar si hay sesgos o inconsistencias. Por ejemplo, utilizar análisis
de regresión para determinar qué variables tienen la mayor influencia en el precio
de la propiedad.
4. Si se encuentran problemas importantes en los datos, considerar volver a
recopilarlos o encontrar formas de ajustarlos para reducir el impacto de los
problemas identificados.
5. Valores atípicos o datos faltantes: Es posible que algunos de los datos recopilados sean
erróneos o que falten valores para algunas variables (Por ejemplo: Algunos valores tienen
como dato “NE” = No especifica).
6. Sesgo de respuesta: Es posible que algunos propietarios o inmobiliarias no hayan
proporcionado información completa o precisa debido a su propio sesgo. Por ejemplo, los
propietarios o las inmobiliarias proporcionan información incorrecta sobre las
características de una propiedad, como el número de habitaciones o la presencia de
ciertos servicios como una piscina o un gimnasio. Esto podría afectar la calidad de los
datos y llevar a conclusiones erróneas al momento de analizar los datos.
1. Sesgo de selección: Al recopilar datos únicamente por páginas web, puede haber
un sesgo en los tipos de propiedades y proyectos que se incluyen en tus datos. Por
ejemplo, es posible que no se hayan considerado propiedades que no se anuncian
en línea o proyectos más pequeños que no se comercializan de la misma manera
que los grandes proyectos. Esto puede llevar a conclusiones erróneas o
incompletas al momento de analizar los datos. Asimismo, es posible que los datos
no sean representativos de todas las propiedades que existen en el mercado
inmobiliario.
2. Falta de actualización: Es posible que algunos de los datos que se recopiló estén
desactualizados. Las propiedades pueden haberse vendido o los proyectos pueden
haber cambiado desde la última vez que se publicaron los datos en línea.
3. Inconsistencia en la calidad de los datos: Es posible que los datos que se
recopilaron no sean consistentes en términos de formato y calidad. Por ejemplo,
algunas propiedades pueden tener información incompleta o mal escrita, lo que
dificulta su comparación y análisis.