Uruguayos desarrollan modelo informático para potenciar estudios sobre genoma humano

0
1745

El producto permitiría ahorrar mucho dinero que actualmente se invierte en investigaciones y potenciar el análisis sobre los datos ya existentes.

Una «idea novedosa» que brinda nuevas oportunidades a científicos uruguayos, y que fue ganadora de los fondos de Microsoft Research para el desarrollo de la investigación.

 

Entrevista emitida el viernes 20/03/09 en Producción Nacional — 1410 AM LIBRE

La relación entre los genes y las enfermedades se ha convertido en una cuestión central de la biología. Aquí en nuestro país hay un grupo de investigación que está desarrollando un modelo informático que permite analizar y combinar los resultados de estudios internacionales sobre el genoma humano.

Hugo Naya, Jefe de la Unidad de Bioinformática del Instituto Pasteur y Lorena Etcheverry, investigadora del Instituto de Computación de la Facultad de Ingeniería, pretenden reutilizar la información de estos estudios, que hoy por hoy son tan caros que solamente pueden ser realizados por grandes laboratorios. Este grupo de investigación ya obtuvo distintos financiamientos: fue uno de los seis ganadores del concurso Microsoft Research para apoyar el desarrollo de modelos informáticos para estudiar el genoma humano. Se habían presentado 40 trabajos de 39 instituciones de distintos puntos del mundo y este grupo uruguayo fue uno de los que ganó. Ganaron US$ 60.000, que para el Uruguay debe de ser de gran ayuda.

 

Alejandro Landoni — ¿Qué es la Bioinformática?

 

Hugo Naya — La Bioinformática tiene una historia relativamente reciente, es una conjunción de dos grandes áreas pero también integra otras. La propuesta es básicamente la conjunción de la Biología y la Informática; o la aplicación de herramientas informáticas para una Biología un poco distinta, una Biología muy basada en datos.

Las técnicas experimentales modernas permiten obtener un conjunto enorme y gigantesco a veces de datos (en particular, en el caso de este proyecto que nosotros trabajamos; son matrices de millones de columnas por miles de filas), entonces es necesario recurrir a tratamientos informáticos muy complejos para poder dar con esa respuesta a los problemas generados por esa cantidad de información. También incluye otras áreas como la Física, la Matemática, la Estadística, etcétera.

Aprovecho a pasarle una novedad a nivel nacional: el Programa de Desarrollo de las Ciencias Básicas (Pedeciba), acaba de lanzar este año la Maestría en Bioinformática, lo que es un logro extremadamente importante. No existen muchas ofertas en la región de Maestrías en Bioinformática, y es un esfuerzo del Pedeciba, con la Universidad de la República, el Instituto Clemente Estable y el Instituto Pasteur de Montevideo, que va a permitir crear una nueva generación de egresados pero ya con un perfil bastante particular. Hasta ahora lo que veníamos trabajando con el grupo de Raúl Ruggia (Catedrático del Instituto de Computación) -al cual pertenece Lorena- es un poco interaccionando desde dos visiones distintas, pero sin gente especialmente formada en la Interfase. Ahora vamos a tener la oportunidad de formar gente en la Interfase por primera vez.

 

A.L. — ¿Cuándo empieza la Maestría?

 

H.N. — El 16 de abril es el comienzo de cursos y las inscripciones son hasta el 31 de marzo.

 

A.L. — ¿Se puede decir que Uruguay está a la par del primer mundo en Bioinformática? ¿Cómo estamos a nivel mundial en estos temas?

 

H.N. — En principio, creo que no estamos al mismo nivel. En general, América Latina está bastante retrasada a nivel de Bioinformática, lo que no quiere decir que no existan oportunidades donde la base sean las ideas novedosas.

Creo que todavía tenemos esa capacidad de generar ideas novedosas y tenemos un muy buen nivel técnico en alguna de las áreas (o en las dos áreas por separado), lo que no hay es una experiencia de trabajo conjunto en Bioinformática. Entonces, cuesta un poco llegar a esa Interfase. Con el grupo de Lorena y Raúl ya hace varios años que venimos discutiendo las ideas y eso fue un poco lo que permitió concretar, pero son eventos esporádicos. Creemos que con la Maestría apuntamos un poco a eso, a que se pueda formalizar como algo continuo.

 

A.L. — El genoma humano contiene la información básica necesaria para el desarrollo físico de un ser humano completo. ¿Para qué sirve conocer el genoma humano?

 

H.N. — Como usted decía, el genoma humano contiene la información que le permite al organismo crear o codificar lo que después somos nosotros como seres vivos. Tiene toda la información necesaria para eso.

Entonces, el conocimiento del genoma —más allá de la importancia que puede tener desde el punto de vista de la investigación—, permite en muchos casos reconocer enfermedades que son de origen genético y a su vez permite identificar susceptibilidades a enfermedades, lo que creo es el punto que en este momento está motivando la investigación fuerte en Genómica. Es decir, mirando el genoma se puede predecir si alguna persona va a desarrollar alguna enfermedad en el futuro, por ejemplo diabetes. ¿Cuál es la propensión a desarrollar ese tipo de enfermedades?

Esto puede ser mal enfocado —tomarse como un filtro para elegir a determinadas personas para un trabajo, lo que implica que hay que hacer todo un desarrollo ético paralelo—; o puede simplemente servir para la Medicina Preventiva. Por ejemplo, si sé que usted tiene una gran propensión a tener una enfermedad del corazón, entonces puedo desde que es chico empezar a tratarlo de otra forma.

Quiero hacer una aclaración: usted hablaba de las grandes empresas, y es verdad que hay estudios financiados por grandes empresas, pero también la comunidad científica, las Universidades y muchos grupos de Facultades de Medicina están interesados en ésto y muchos financian este tipo de estudios. No sólo las grandes empresas o los grandes laboratorios financian este tipo de estudios. Creo que a ellos les interesan mucho por razones obvias, pero también hay financiamiento de las Universidades.

 

A.L. — ¿En qué consisten los estudios en los que están trabajando?

 

Lorena Etcheverry — Estos estudios se llaman de «Asociación Genómica», pero asociación genómica a través de todo el genoma, por eso la sigla GWAS.

Básicamente, buscan encontrar lo que su nombre indica: alguna forma de asociación entre enfermedades, patologías, o características visibles en la persona —características del fenotipo—, y su relación con características genómicas de la persona. Apuntan a poder encontrar cuáles son los marcadores o la información que está dentro del genoma que me indica, por ejemplo, que esa persona puede llegar a generar tal enfermedad, patología o característica.

 

H.N. — Lo que nosotros vimos como perspectiva es que la mayor parte de la información es pública, con determinados niveles de seguridad por razones éticas, pero usted puede acceder a toda la información genética de la persona y usted no sabe quiénes son, (éso está protegido); y también saber cuál es el fenotipo; o sea, cuál es la visión clínica que tiene cada una de esas personas.

Obtener esa información sale bastante caro; sale varios millones de dólares. Un estudio puede salir entorno a los US$ 5:000.000 o US$ 6:000.000 para cada enfermedad en particular, con una población en particular.

 

A.L. — ¿Son estudios que se hacen con muchas personas?

 

L.E. — En el entorno de mil personas, a veces más.

 

H.N. — En general, un poco más… en torno a 6.000; 3.000, y 3.000 es un número razonable, pero eso depende mucho de la enfermedad y la diferencia que haya entre los sanos y los enfermos en cuanto al nivel en que se expresa la enfermedad.

Entonces, esos estudios salen caros y a nosotros se nos ocurrió que como eso es público, estaría bueno poder utilizar la información de los estudios y poder combinarla con otros fines (para otras enfermedades distintas de las que fueron diseñados). Porque las enfermedades del primer mundo son distintas que las enfermedades del tercer mundo y va a haber muchos más estudios que ataquen a las enfermedades del primer mundo y muchos menos de las del tercer mundo, pero igual está bueno poder utilizar la información generada en ese primer mundo para las enfermedades de acá.

Pensando un poco, se nos ocurría que bajo determinadas condiciones se podía combinar toda esa información existente y reorientarla hacia algo distinto.

 

A.L. — ¿Cuál es el criterio que tienen que tener sobre esos datos? ¿Son buenos esos datos? ¿Con qué calidad fueron obtenidos? ¿Cómo saben si esa base de datos a las que ustedes acceden con millones de datos, les sirven para reutilizarlos o no?

 

H.N. — Quiero destacar que una de las características de esos datos es que además de ser muy numerosos, son heterogéneos. A la Biología es muy difícil encuadrarla en la Informática o en los estándares de la Informática. Se puede decir que describir a una persona es mucho más difícil que meter números en algún tipo de matriz.

Entonces, pese a que en Biología se han desarrollado muchos estándares, que es lo que se conoce como ontologías —formas de ordenar la información—; pese a eso es muy difícil describir la información que uno tiene. La información genética es relativamente fácil, pero la información fenotípica no: una historia clínica es muy difícil traducirla desde lo que el médico escribe, a un conocimiento ordenado y comparable. Dos pacientes con una historia clínica: ¿son comparables?, ¿tienen las mismas enfermedades?, ¿o son enfermedades distintas?

Esa heterogeneidad de datos es lo que hace que nuestra propuesta sea relativamente interesante. Si las cosas fueran muy sencillas de comparar (pese a que son muchos los datos), si no hubiera problema de complejidad en la información, creo que se solucionaría muy fácil.

 

A.L. — ¿Qué cantidad de datos manejan por ejemplo?

 

H.N. — Calcule a nivel genotípico —que es algo muy sencillo—, el tipo de los datos podrían tomar tres valores, por ejemplo: 0, 1 y 2 en una codificación, pero usted tiene una matriz que tiene un millón de columnas por 6.000 filas, entonces estamos hablando de 6.000:000.000 de numeritos.

 

L.E. — De valores.

 

H.N. — Son muchos y en un solo estudio.

 

L.E. — Lo primero, es extender la noción de «calidad de datos» que a uno se le viene a la cabeza, porque cuando uno piensa en calidad, la primera interpretación es si es correcta o no, si está bien escrita o no. Para poder aterrizarlo a esa noción de «correctitud», uno tiene que tener una forma de comparar esa representación de la realidad, que es ese número, contra la verdad.

Calidad puede querer decir: ¿puedo comparar la enfermedad de estas dos personas pensando que son la misma?, ¿cuán distintas son?, ¿cuán lejos está una de la otra? Eso tiene que ver con la precisión con que está especificada la historia clínica, uno de los aspectos que citaba anteriormente Hugo.

Con respecto a los datos del genotipo de la persona; cuando uno habla de genotipo está hablando de tener de alguna manera información sobre lo que pasa con ese individuo. ¿Qué pasa dentro de la información genética de ese individuo en particular? Hay varias formas de medir eso.

Puedo tener estudios donde están medidos de una manera o de otra manera, ¿cómo puedo hacer para combinar esos estudios?, ¿cómo puedo hacer para compararlos? También, establecer criterios de cuándo es combinable y cuándo no lo es.

Lo que me interesa transmitir es que la calidad es más que el dato numérico, se extiende un poco más.

 

A.L. — Eso que algunos llamaron el «filtro de calidad».

 

L.E. — Algo así. De hecho, en los primeros meses del proyecto nos abocamos todos juntos a tratar de desentrañar de la bibliografía y consultando con expertos, qué es lo que tiene sentido medir como calidad en este contexto particular.

Si a un señor biólogo muy experto en estos estudios le pido que me defina cuándo un estudio es bueno… ¿qué cosas mira? Y si tiene que combinar ¿qué cosas mira?, ¿qué le importa mirar?

Después de esa etapa, viene una etapa más de implementación donde empezamos a bajar a tierra éso; cómo se mide efectivamente y cómo se llega a una herramienta que ayude a elegir esos estudios.

 

A.L. — En el caso de que su investigación sea exitosa ¿cuál es el aporte a la ciencia?

 

H.N. — Creo que nuestra investigación es exitosa desde el punto de vista de que hemos logrado conformar un grupo que trabaja sobre un tema que en cierta forma es un nivel «de punta», entonces, en ese sentido ya es exitosa.

Igual, lo que nosotros proponíamos en el proyecto era simplemente un prototipo. No estábamos proponiendo desarrollar un software de nivel acabado, y básicamente lo que intentamos desarrollar es una metodología: cómo se hace para combinar información de este tipo de fuentes que son heterogéneas.

El principal aporte es que si uno encuentra la forma de combinar éso, lo que está haciendo es ahorrar mucha plata porque son estudios muy costosos, o replicando estudios que también son muy costosos; permite acceder a resultados en forma mucho más rápida. Si usted tiene que diseñar un estudio de este tipo lleva bastante tiempo, porque si bien el genotipado es bastante rápido, conseguir la población, sacar sangre, los procesamientos de las muestras, todos los chequeos de calidad de cada una de esas etapas lleva mucho tiempo. Entonces —entre otras cosas—, permite adelantar conocimientos; permite generar hipótesis nuevas.

Creo que es una forma de potenciar la investigación a partir de datos que ya existen.

 

A.L. — ¿Cuándo culmina este proyecto?

 

H.N. — La finalización del proyecto es en junio de este año. Actualmente estamos comenzando la parte de desarrollo del software y nos proponemos continuar con la propuesta porque creemos que tiene potencialidad para trabajar bastante más que este año.

Y probablemente apliquemos a alguna otra fuente de financiamiento.

 

A.L. — ¿Qué servicios se pueden proyectar?

 

L.E. — En realidad, la idea de proyectar servicios es que uno puede ofertarle al resto de la comunidad científica, académica o aún a empresas, conocimiento, que es una inversión del país.

En ese sentido, tenemos una vocación de servicio. No es solamente investigar en algo que nosotros consideramos que es importante, sino que todo ese proceso de aprendizaje (que nosotros sencillamente somos unos de los que podemos tenerlo), queremos ofertarlo al resto de la comunidad y si hay gente a la que le interesa algún tipo de análisis que nosotros podemos realizar.

En la Bioinformática actualmente, una vertiente muy importante es justamente eso, grupos que sirven a otros grupos. Los grupos de Bioinformática con gente muy especializada, con capacidad de analizar enorme volúmenes de datos; y analizarlos para otros grupos que generan los datos y que quizás tengan hipótesis fuertes, pero que después no saben cómo lidiar con ese tipo de información.

En ese sentido creo que es una responsabilidad como institución nacional —como es nuestro caso—, y financiado por el país; poder financiar ésto al resto de la comunidad.

No hay comentarios

Dejar respuesta