Nadie duda de que los datos son actualmente uno de los recursos más importantes. Las compañías usan los datos para segmentar clientes y aumentar las probabilidades de venta. Las administraciones utilizan los datos para mejorar la toma de decisiones. Existen repositorios públicos de datos de múltiples usos, por ejemplo, para machine learning.
Sin embargo, la situación aparente no coincide con la real, no al menos en Ingeniería de Software. Los grandes problemas del pasado, como la motivación para realizar replicaciones, no se han solucionado. No es fácil identificar conjuntos de datos interesantes para meta-análisis. Por no existir, no existe ni siquiera un vocabulario estandarizado que permita una indexación y búsqueda eficientes de datos.
En esta charla, haré un repaso de los problemas relacionados con los datos en la investigación empírica de Ingeniería de Software. Desde una perspectiva personal, y probablemente cronológica, desgranaré los avances ocurridos en los últimos veinte años, que he vivido en primera persona. Los cincuenta son un buen momento para este ejercicio. Describiré también lo que me hubiera gustado hacer, pero no he conseguido todavía, como es crear repositorios multi-área o la realización de experimentos en múltiples centros.
No pretendo adivinar el futuro. No podría. Pero si pretendo proporcionar una agenda de trabajo, ciertamente personal y centrada en los datos, que también podría ser útil para la Ingeniería de Software como comunidad
TICEC is the most important conference on Information and Communication Technologies in Ecuador. Every year this event brings together researchers, students and professionals in the field of ICTs to share knowledge, know-how and experiences in the field of design, development and application of ICTs in several fields.