• Cotizaciones
    jueves 05 de septiembre de 2024

    ¡Hola !

    En Búsqueda y Galería nos estamos renovando. Para mejorar tu experiencia te pedimos que actualices tus datos. Una vez que completes los datos, tu plan tendrá un precio promocional:
    $ Al año*
    En caso de que tengas dudas o consultas podés escribir a [email protected] o contactarte por WhatsApp acá
    * Podés cancelar el plan en el momento que lo desees

    ¡Hola !

    En Búsqueda y Galería nos estamos renovando. Para mejorar tu experiencia te pedimos que actualices tus datos. Una vez que completes los datos, por los próximos tres meses tu plan tendrá un precio promocional:
    $ por 3 meses*
    En caso de que tengas dudas o consultas podés escribir a [email protected] o contactarte por WhatsApp acá
    * A partir del cuarto mes por al mes. Podés cancelar el plan en el momento que lo desees
    stopper description + stopper description

    Tu aporte contribuye a la Búsqueda de la verdad

    Suscribite ahora y obtené acceso ilimitado a los contenidos de Búsqueda y Galería.

    Suscribite a Búsqueda
    DESDE

    UYU

    299

    /mes*

    * Podés cancelar el plan en el momento que lo desees

    ¡Hola !

    El venció tu suscripción de Búsqueda y Galería. Para poder continuar accediendo a los beneficios de tu plan es necesario que realices el pago de tu suscripción.
    En caso de que tengas dudas o consultas podés escribir a [email protected] o contactarte por WhatsApp acá

    El INE estudia extraer precios de la web para calcular el IPC

    Usaría web scrapping para rubros como los pasajes de avión

    El Índice de Precios al Consumidor (IPC) es uno de los más sensibles y conocidos por la gente: mide la inflación, es decir, la variación del costo de vida en cada mes. Para calcularlo, el Instituto Nacional de Estadística (INE) releva datos de una canasta de bienes y servicios; algunos se los informan directamente los comercios y otros son recabados mediante la visita de un funcionario del organismo a los distintos establecimientos. Pero ahora está incorporando otras fuentes y formas de recolección de precios.

    Mediante la extracción automática de precios de la web, el INE “pretende no solamente recolectar mayor volumen de datos en menor tiempo” y con más frecuencia, sino también “disminuir el costo de la obtención”, dijo Gastón Presto, asesor de la división de normalización e investigación en proyectos del organismo.

    En el webinario titulado Big Data para las Estadísticas en América Latina y el Caribe organizado semanas atrás por el Hub Regional de las Naciones Unidas para Big Data, técnicos de los institutos de estadísticas de Chile, Brasil y Uruguay compartieron experiencias en el uso del web scraping (“raspado web”, en inglés), una técnica automática para extraer datos de Internet sobre precios incluidos en la canasta del IPC. El INE pretende incorporarla para la medición de este indicador, al que cambió su año base en octubre de 2022.

    Ese evento formó parte de la serie de webinarios Rumbo a Punta del Este Festival de Datos, organizados para promocionar el festival que se desarrollará entre el 7 y 9 de noviembre. Previamente, del 3 al 6 de ese mes, se realizará el primer Dathaton, convocado por la Organización de las Naciones Unidas en Uruguay, que tendrá lugar en la sede del INE, en Montevideo.

    Scraping.

    La incorporación de técnicas como el web scraping para el cálculo del IPC es algo que el Fondo Monetario Internacional había recomendado al INE el año pasado. El organismo estadístico confirmó a Búsqueda que prevé implementarlo para los precios de los pasajes aéreos. En Brasil y Chile también se utiliza para relevar precios de compra y alquiler de autos, alojamiento en hoteles y productos electrónicos, entre otros.

    Presto, junto con la analista de datos Ana Samaniego, presentaron el caso de los pasajes aéreos y otros dos que son de estudio para Uruguay. Explicaron que el INE cuenta con tres métodos de extracción de precios y que estas técnicas “son una cuarta forma de relevar y almacenar datos, que cuando se corre el cálculo a fin de mes se van a usar como insumo”.

    En el caso de los pasajes de avión, Presto señaló que los precios se obtenían de forma manual, una vez por semana, en un proceso que “consumía tiempo de recursos humanos y relevaba una cantidad relativamente baja” de valores. Una alternativa es usar un programa automatizado de recolección de precios de la web que, dijo, permite obtener mucha más cantidad de precios en menor tiempo y sin requerir interacción, lo que “libera recursos humanos para otras tareas”. Ese software realiza la búsqueda de precios con las especificaciones del INE para la totalidad de las aerolíneas “todos los días y demora 10 minutos”, según el asesor. Luego, esos datos se procesan para, finalmente, obtener el precio del producto pasaje de avión que se incorpora como referencia para el cálculo del índice de inflación. Según Samaniego, lo que queda pendiente para la implementación de esta técnica es “extender a los técnicos del IPC el mantenimiento del programa”.

    Precios tecno

    Un caso de estudio es el de los productos tecnológicos. Se trata de artículos que, por los constantes avances técnicos, sus “características, la calidad y, por tanto, el precio” varían “con gran velocidad, haciendo que las metodologías convencionales no logren reflejar fielmente la variación única del precio (…). Esto lleva a buscar una solución para poder reflejar únicamente la variación del precio, limpio de los cambios en la calidad”, explicó la analista del INE.

    Una forma de hacerlo es “identificando cómo impacta el cambio de la calidad en el precio mediante un modelo estadístico”, mencionó Samaniego, pero este método necesita relevar datos de manera masiva y con el mayor detalle posible. Para hacerlo hay dos vías: el web scraping o una interfaz de programación de aplicaciones (API), herramienta de desarrollo web que también permite acceder a datos en una página. En este caso, el INE optó por esta segunda alternativa para acceder a datos de precios de notebooks, celulares y computadores de escritorio, entre otros.

    “Mediante el modelo —que está en prueba— se relaciona el precio de una notebook con la velocidad del procesador y el disco duro”, entre otros componentes. Y de esta forma se obtiene “un antes y un después de la variación de la calidad y un factor hedónico que permite ajustar el precio de este tipo de productos”, explicó Samaniego.

    Para la aplicación de esta técnica hace falta “llegar a un consenso sobre los atributos que se relevan” en estos tipos de productos, mejorar la extracción de datos por la API y encontrar otra fuente —para el caso de las computadoras—, dado que en general “se ofrecen junto con otros bienes”, como mouse o sillas, lo que dificulta discriminar el precio de cada ítem, detalló.

    Por último, la analista adelantó otro proyecto que todavía no está operativo, pero que se está estudiando. Se trata de “el acceso a la API de Uber para relevar precios de productos de transporte de pasajeros con chofer”.