CRAG: “Deep learning” per a la millora genètica d’espècies poliploides
Un article publicat recentment mostra com els nous mètodes computacionals poden ajudar a la millora genètica d’espècies amb més de dos jocs de cromosomes.
La millora genètica d’espècies vegetals és un procés llarg i complex, especialment en espècies poliploides (amb més de dos jocs de cromosomes). Un treball recent, dirigit per l’investigador ICREA al Centre de Recerca en Agrigenòmica (CRAG), Miguel Pérez-Enciso, en col·laboració amb la Universitat de Florida, mostra que la classe d’algoritme d’aprenentatge automàtic conegut com a ‘aprenentatge profund’ (‘deep learning’, en anglès) pot ser una eina útil per accelerar la millora de caràcters complexos en algunes espècies d’interès agronòmic. Els investigadors ho han demostrat en dues de les espècies poliploides més importants: la maduixa i el nabiu. L’equip investigador ha donat accés obert al programa informàtic necessari per a la seva implementació.
Molts caràcters d’interès en plantes són complexes
El desenvolupament de noves varietats de cultius sol consistir en un procés de prova i error on línies ‘elit’ consolidades es creuen i s’avalua l’èxit de la descendència. En determinats casos, algunes de les línies de la descendència presenten millores en algun caràcter d’interès, com ara la resistència enfront de malalties o en el gust, i acaben substituint les línies elit. Aquet és un procés continuo i, malauradament, lent. Per exemple, el temps per desenvolupar una nova varietat de maduixa és de més de vuit anys.
Per aquesta raó els milloradors s’esforcen en accelerar aquest procés utilitzant tecnologies modernes basades en la genòmica. Una possibilitat és fer proves genètiques per la identificació dels creuaments i individus més favorables. Aquesta tècnica, coneguda com a selecció assistida per marcadors (MAS, de l’anglès ‘marker-assisted selection’), requereix que els gens i les mutacions responsables dels caràcters d’interès siguin coneguts. Malauradament, i contràriament al que se sol pensar, els gens responsables de la variació dels caràcters d’interès econòmic només es coneixen parcialment. De fet, fins al moment, s’han descrit poques mutacions causals. A més, l’expressió de diversos caràcters com el sabor, no depèn només dels gens sinó també de les condicions ambientals en les que creix la planta. Els milloradors defineixen aquestes característiques com ‘complexes’ perquè depenen de l’ambient i de nombrosos gens que estan només parcialment caracteritzats.
Què es pot fer en aquests casos? Una vegada més, els mètodes moleculars poden ajudar amb una aproximació complementaria anomenada ‘predicció genòmica’. Aquest procediment consisteix en la utilització de tots els marcadors moleculars disponibles, incloent-hi candidats que no s’han validat prèviament, per a ‘predir’ els resultats dels creuaments entre diferents varietats. Aquest procediment se sol fer utilitzant variants del conegut mètode de regressió lineal.
Com el “deep learning” pot ajudar
La majoria de mètodes de predicció genòmica assumeixen una relació relativament simple entre els marcadors genètics i els caràcters d’interès.
«En canvi, nosaltres hem utilitzat algoritmes de “deep learning”, que són extremadament flexibles en la relació que assumeixen entre els marcadors i els caràcters d’interès» explica Laura Zingaretti, estudiant de doctorat i primera autora de l’estudi.
El “deep learning” o aprenentatge profund inclou una classe d’algoritmes que van ser inspirats en el funcionament del cervell humà i que parcel·len el procediment computacional en petites unitats anomenades ‘neurones’. Aquesta metodologia és extremadament popular avui en dia i té moltes aplicacions, des de la traducció automàtica (p.ex. https://www.deepl.com/translator) fins a l’anàlisi de vídeo i so.
En aquest estudi publicat ara a la revista Frontiers in Plant Science, els autors van aplicar metodologies d’aprenentatge profund per a la predicció genòmica en dues espècies d’interès hortícola: les maduixes i els nabius.
«Totes dues espècies tenen una estructura genètica altament complexa ja que són poliploides, és a dir, tenen més de dos jocs de cromosomes», explica la investigadora de l’IRTA al CRAG Amparo Monfort, especialista en genètica de maduixa, que també ha col·laborat en aquest estudi.
És precisament en aquesta mena d’espècies vegetals on la interacció entre gens adquireix una importància major que l’habitual. El ‘deep learning’ pot ser una eina prometedora per a la predicció genòmica en aquests escenaris.
«El nostre estudi és una de les primeres aplicacions del ‘deep learning’ a la predicció genòmica. Hem demostrat que l’aprenentatge profund pot ser molt efectiu en presència d’interaccions entre gens, és a dir, quan no es pot predir un caràcter tenint en compte els gens de manera individual. També hem proporcionat el software per a què pugui ser utilitzat per d’altres investigadors» declara l’investigador principal de l’estudi, Pérez-Enciso.
«Creiem que aquest treball té una rellevància particular per a la indústria espanyola, ja que Espanya és actualment el primer productor europeu de maduixes i sisè a escala mundial», afegeix Amparo Monfort.
—————————————————-
Article de referència: L.M. Zingaretti, S.A. Gezan, L.F. Ferrão, L.F. Osorio, A. Monfort, P.R. Muñoz, V.M. Whitaker, M. Pérez-Enciso. 2020. Exploring deep learning for complex trait genomic prediction in polyploid outcrossing species. Frontiers in Plant Science
Sobre els autors i el finançament de l’estudi: el present estudi s’ha realitzat en col·laboració entre autors del Centre de Recerca en Agrigenòmica (CRAG, Bellaterra, Espanya) i la Universitat de Florida (EUA). El treball dels autors del CRAG ha estat finançat per fons Ministeri de Ciencia i Innovació d’Espanya, per fons FEDER (UE), i per la Generalitat de Catalunya. Els autors dels EUA han estat finançats pel Departament d’Agricultura dels EUA a través del projecte ‘RosBREED’
Sobre el Centre de Recerca en Agrigenòmica (CRAG)
El Centre de Recerca en Agrigenòmica (CRAG) és un centre que forma part del sistema CERCA de la Generalitat de Catalunya, i que es va establir com a consorci de quatre institucions: el Consell Superior d’Investigacions Científiques (CSIC), l’Institut d’Investigació i Tecnologia Agroalimentàries (IRTA), la Universitat Autònoma de Barcelona (UAB) i la Universitat de Barcelona (UB). La investigació del CRAG s’estén de la investigació bàsica en biologia molecular de plantes i animals de granja, a les aplicacions de tècniques moleculars per la cria d’espècies importants per l’agricultura i la producció d’aliments en estreta col·laboració amb la indústria. L’any 2016, el CRAG fou reconegut com a “Centre d’Excel·lència Severo Ochoa” pel Ministeri d’Economia i Competitivitat.♦