
Investigador chileno recibe importante premio internacional en ciencia de los datos
Alejandro Pacheco, investigador del CeBiB y estudiante de doctorado en la Universidad de Chile, ganó el Best Student Paper Award en la conferencia CPM 2025. Su trabajo sobre patrones en textos comprimidos sin descomprimirlos representa un avance clave en el procesamiento de grandes volúmenes.
Alejandro Pacheco, investigador del Centro de Biotecnología y Bioingeniería (CeBiB) y estudiante de doctorado en el Departamento de Ciencias de la Computación de la Universidad de Chile, fue galardonado con el Best Student Paper Award en la prestigiosa conferencia CPM 2025 – 36th Annual Symposium on Combinatorial Pattern Matching, celebrada en Milán, Italia, entre el 17 y el 19 de junio.
El premio fue otorgado por su innovador trabajo titulado “Counting on General Run-Length Grammars”, desarrollado bajo la supervisión de Gonzalo Navarro, académico e investigador principal del CeBiB. Este trabajo propone una nueva estructura de datos que permite contar ocurrencias de patrones en textos comprimidos sin necesidad de descomprimirlos, lo que representa un avance significativo en el procesamiento eficiente de grandes volúmenes de información, como secuencias de ADN o archivos de texto masivos.
Pacheco explica que el desafío de su investigación es similar a una analogía con una biblioteca gigante, donde los libros están comprimidos en cajas especiales para ahorrar espacio. Normalmente, para buscar una palabra específica en todos los libros, se necesitaría descomprimir cada caja, lo cual sería un proceso extremadamente lento. La propuesta de Pacheco y Navarro, sin embargo, permite contar palabras directamente en las cajas comprimidas, sin necesidad de descomprimir los datos.
El trabajo resuelve un problema abierto planteado en 2020 por los investigadores Christiansen et al., quienes en su artículo publicado en ACM Transactions on Algorithms propusieron el desarrollo de un algoritmo eficiente para contar patrones en textos comprimidos mediante gramáticas de tipo Run-Length (RLCFGs). La investigación de Pacheco y Navarro no solo resuelve este desafío teórico, sino que también presenta una aplicación práctica que demuestra su utilidad en escenarios reales de análisis de datos comprimidos.
Implicaciones para la Bioinformática
Este avance tiene importantes implicaciones para la bioinformática, especialmente en el manejo de grandes colecciones repetitivas, como los genomas, que deben almacenarse de manera más eficiente. Según Navarro, el trabajo realizado por Pacheco contribuye significativamente a la investigación en Bioinformática dentro del CeBiB, permitiendo almacenar colecciones genómicas en formatos hasta 100 veces más pequeños que su tamaño original. Además, la investigación facilita la realización de consultas y análisis directamente sobre los datos comprimidos sin necesidad de descomprimirlos.
Este tipo de compresión es clave para hacer más accesibles los análisis bioinformáticos y para realizar investigaciones más rápidas y eficientes en grandes volúmenes de datos genómicos, como el análisis de frecuencias de ciertos motifs, una tarea crucial en la investigación genética.
El reconocimiento de Pacheco con el Best Student Paper Award resalta no solo la calidad de su investigación, sino también la creciente presencia y relevancia de la ciencia chilena en el campo de la computación teórica y aplicada. Gonzalo Navarro subraya que este tipo de premios son fundamentales para la carrera de un estudiante, ya que brindan visibilidad internacional tanto al investigador como al trabajo realizado, lo que abre puertas a futuras oportunidades y colabora en la consolidación de la investigación científica en Chile.
Apoyo y Financiamiento
El trabajo de Pacheco fue financiado por los Fondos Basales para Centros Científicos y Tecnológicos de Excelencia FB0001 de Mideplan (Chile) y el proyecto Fondecyt 1-230755. Además, Pacheco recibió apoyo a través del programa Becas Chile de Doctorado de la Agencia Nacional de Investigación y Desarrollo (ANID).
La conferencia CPM, uno de los encuentros más importantes a nivel mundial en el ámbito del análisis de patrones y algoritmos sobre cadenas, es un evento clave que reúne cada año a especialistas en computación teórica y aplicada. El galardón a Pacheco no solo destaca su labor, sino también la calidad de la investigación chilena en un campo científico altamente competitivo.