El genoma es el conjunto de información genética necesario para el desarrollo y sostenimiento de un ser vivo. En organismos eucariontes, el genoma puede estar constituido por miles de millones de pares de bases de ADN, cuya modificación deliberada, es decir, la capacidad de introducir cambios en secuencias específicas de manera precisa ha sido materia de un gran número de investigaciones. En este contexto, con “edición genómica” —también conocido como “edición genética” e “ingeniería genómica”— nos referimos a la capacidad de efectuar cambios en el código genético de una célula u organismo, tales como insertar, sustituir o eliminar secuencias o bases específicas de ADN. Durante décadas, la edición del genoma estuvo restringida por la naturaleza estocástica de las metodologías empleadas; además, su aplicación se limitaba a unas cuantas especies. En contraste con esas metodologías, la concepción de que la escisión programada del ADN conduce a la introducción de alteraciones genómicas de forma localizada, derivó en el desarrollo de herramientas de edición genómica con capacidades de edición más precisas.
En general, el principio básico de la edición genómica consiste en generar un DSB (“double strand break”) en el locus genómico de interés. Esta ruptura puede repararse a través de uno de los dos principales mecanismos endógenos de reparación del ADN: (1) la unión de extremos no homólogos, y (2) la reparación dirigida por homología (NHEJ y HDR, respectivamente, por sus siglas en inglés). De manera general, NHEJ es el mecanismo de reparación predominante. Esta vía se caracteriza por su naturaleza propensa a errores, ya que frecuentemente deviene en la inserción o deleción (“indels”) aleatoria de nucleótidos en o cerca del sitio de escisión del ADN. La reparación dirigida por homología (HDR), en cambio, puede emplearse para introducir mutaciones puntuales, así como insertar o reemplazar secuencias específicas de ADN. No obstante, la reparación del DSB mediado por HDR ocurre con menor frecuencia, además de requerir de una secuencia molde que contenga la modificación genética que se desea incorporar.
La escisión del ADN, por su parte, puede generarse de forma secuencia-específica a través de nucleasas programables, lo que permite estimular la recombinación del ADN e introducir las alteraciones genómicas de interés de manera localizada —de allí el término edición genómica—.
Con el objetivo de introducir DSBs en el genoma de células de origen vegetal y animal, a inicios de 1990 se utilizaron las primeras nucleasas de secuencia específica. Aunque inadvertido al principio, estos estudios establecieron los principios básicos de la ingeniería genómica que, en conjunto con otros descubrimientos de la época, condujeron al desarrollo de las primeras herramientas de edición genómica a partir de nucleasas programables. En la actualidad, tres principales nucleasas programables han sido introducidas como herramientas novedosas de edición genómica, cuyas capacidades de edición poseen un control, precisión y aplicabilidad sin precedentes: i) nucleasas de dedos de zinc (ZFNs); ii) nucleasas efectoras de tipo activador de la transcripción (TALENs); y iii) varios tipos de nucleasas guiadas por moléculas de ARN derivadas de los sistemas CRISPR/Cas. De manera general, el mecanismo con el que operan estos sistemas es conceptualmente el mismo: generar un DSB en el sitio genómico de interés a partir de una enzima endonucleasa. Gracias a la capacidad programable de las proteínas modulares de unión al ADN de los sistemas ZFNs y TALENs, así como del ARN guía de cadena sencilla (sgRNA) de los sistemas CRISPR/Cas, la secuencia genómica de interés puede ser localizada. Posteriormente, la escisión del ADN estimula los mecanismos endógenos de reparación del ADN, los cuales pueden conducir a la introducción de indels o el reemplazo de la secuencia original dependiendo de la edición deseada.
Pese a numerosas demostraciones exitosas de edición genómica en varios organismos, el diseño y la construcción poco asequible, además de altamente laborioso, de los sistemas ZFNs y TALENs, han ocasionado que estas herramientas sean rápidamente sustituidas por la sencillez y facilidad de uso del sistema CRISPR/Cas9.
Éste se constituye por una endonucleasa de ADN dirigida por un ARN guía, el cual es híbrida de manera específica e induce una ruptura de doble cadena en secuencias complementarias de ADN. Así, la Cas9 puede programarse fácilmente para introducir un DSB en un objetivo genómico en específico tan solo con personalizar un sgRNA homólogo al sitio de interés. Lo anterior no solo ha llevado a considerar al sistema CRISPR/Cas9 como una de las herramientas de edición genómica contemporáneas más asequibles y fácil de diseñar, sino también altamente eficiente y específica para llevar a cabo las modificaciones genéticas de interés en el genoma de virtualmente cualquier organismo.
Más allá del “corta y pega” con CRISPR/Cas9
En 2012, la capacidad bioquímica de escindir ADN de doble cadena in vitro a partir de la reconstrucción parcial del sistema CRISPR/Cas tipo II de la bacteria S. pyogenes estableció las bases para la concepción y validación de una nueva herramienta de edición genómica: el sistema CRISPR/Cas9.
Tras la demostración inicial de su uso potencial como instrumento de edición genómica, un amplio número de estudios validó la capacidad programable del complejo Cas9-sgRNA para introducir DSBs in vivo e in vitro. A la fecha, el sistema CRISPR/Cas9 de S. pyogenes (SpCRISPR/Cas9) ha permitido introducir modificaciones genéticas puntuales en el genoma de una amplia gama de organismos. En la actualidad, sin embargo, sus aplicaciones no se limitan a su actividad endonucleasa; la versatilidad con la que se puede modificar a la Cas9 proporciona nuevas herramientas que permiten emplear al sistema SpCRISPR/Cas9 más allá de la edición de genomas.
Por ejemplo, la abolición de su actividad endonucleasa —resultado de introducir mutaciones puntuales en los dominios catalíticos HNH y RuvC de la Cas9— convierte a la Cas9 en un dominio genérico de unión al ADN incapaz de inducir un DSB. La proteína Cas9 catalíticamente inactiva (dCas9, por sus siglas en inglés) todavía conserva la capacidad de unión al ADN, por lo que puede programarse sencillamente para adherirse a un objetivo genómico en específico, tan solo con personalizar una secuencia guía homóloga al sitio de interés.
En lugar de alterar de manera irreversible la información genómica, el complejo dCas9-sgRNA proporciona un sistema fácil, dinámico y multifuncional para el reclutamiento secuencia-específico de proteínas con funciones más allá de la edición genómica, tales como la regulación programada de la transcripción, la modificación dirigida de marcas epigenéticas y la visualización del genoma, “genome imaging”. En particular, la unión a dCas9 de dominios autónomos de activación o represión transcripcional constituye un poderoso conjunto de herramientas para la regulación deliberada y reversible de la expresión génica (los sistemas CRISPRa y CRISPRi, por sus siglas en inglés, respectivamente); tanto para activar genes de interés como para reprimir su transcripción. En general, el mecanismo con el que operan estos sistemas se basa en la capacidad del complejo dCas9-sgRNA para actuar como un andamio con el cual se pueden reclutar, de manera predecible y fácilmente programable, diversas proteínas efectoras —proteínas o dominios proteicos, entre los que se incluyen activadores y represores transcripcionales, usualmente fusionados a la dCas9—. Por lo general, la proteína reguladora anexa es dirigida a la región promotora o codificante de un gen con el fin de modular la expresión de este último. De esta forma, si, por ejemplo, se plantea “activarlo”, se fusionan activadores transcripcionales a la dCas9, mientras que, si lo que se pretende es “reprimirlo”, se emplean represores de la transcripción.
La expresión génica, sin embargo, no solo depende de la presencia o ausencia de reguladores transcripcionales, sino también de la accesibilidad de la cromatina. En este sentido, la modificación dirigida de marcas epigenéticas asociadas a un estado transcripcionalmente activo o inactivo de la cromatina emerge como un método alternativo para la modulación transcripcional de genes endógenos. Así, el sistema CRISPR/dCas9 proporciona un mecanismo de localización secuencia-específico de proteínas basado en pequeños fragmentos de ARN fácilmente personalizables, que permite localizar el efector epigenético anexo en la región genómica de interés, de tal forma que pueden establecerse relaciones causales entre la presencia de la proteína efectora anexa, los cambios epigenéticos inducidos y su efecto en la expresión o el silenciamiento génico.
El sistema CRISPRa
En general, la unión de proteínas efectoras de funciones reguladoras distintas en cualquiera de los extremos C- o N-terminal de la dCas9 ha generado un conjunto de herramientas moleculares capaces de regular la transcripción de forma precisa. En el caso particular del sistema de activación transcripcional inducida por CRISPR/dCas9 (CRISPRa), la proteína reguladora anexa consiste generalmente en un dominio activador, el cual, una vez localizado, promueve la transcripción del gen o el grupo de genes objetivo.
De manera similar, marcas epigenéticas asociadas a un estado transcripcionalmente activo pueden ser reclutadas en loci genómicos definidos, para directa o indirectamente inducir un estado permisivo en la cromatina y favorecer la transcripción. En general, el reclutamiento de efectores epigenéticos por parte de la dCas9 ha dado lugar a un gran número de alteraciones epigenéticas en el ADN y las histonas. En especial, las modificaciones post-traduccionales de las histonas (PTHMs) constituyen un mecanismo evolutivo conservado ampliamente asociado a diversos procesos biológicos de la célula eucariota, tal como la regulación de la activación y el silenciamiento génico. La región amino-terminal de las colas de las histonas están sujetas a varias modificaciones post-traduccionales, cuya adición o eliminación puede alterar la compactación de la cromatina y, por consiguiente, modular la accesibilidad de factores de transcripción y otras proteínas al ADN.
Aplicaciones del sistema CRISPRa
El desarrollo de variedades resistentes a estrés biótico es una de las estrategias de protección de cultivos ambientalmente más sostenibles. Históricamente, técnicas tradicionales de mejoramiento genético vegetal como la selección artificial, la hibridación, y más recientemente, la mutagénesis inducida, entre otros, han contribuido a la mejora genética de la resistencia a plagas y enfermedades agrícolas. Desde hace tres décadas, el fitomejoramiento convencional ha sido complementado con la transgénesis —proceso a través del cual, secuencias exógenas de ADN son introducidas en el genoma vegetal, que confieren a las plantas rasgos de interés agronómico generalmente intransferibles por medio de métodos convencionales—. La mejora tradicional de la resistencia en plantas, sin embargo, requiere de mucho tiempo y esfuerzo, además de ser inespecífica, de modo que los programas de mejoramiento genético vegetal basados en métodos convencionales no pueden seguir el ritmo de las crecientes demandas alimentarias ni de la adaptación constante de poblaciones de insectos y patógenos. Asimismo, pese a que la introducción de transgenes ha derivado en el desarrollo de variedades resistentes, así como en cultivos con propiedades nutricionales mejoradas, entre otras características que han permitido incrementar la producción global de alimentos, así como disminuir el uso de pesticidas y mejorar la nutrición, muchos factores continúan limitando el cultivo y la comercialización de plantas transgénicas en la actualidad.
Recientemente, avances tanto en la edición como en la regulación deliberada de la información genómica han permitido trascender gran parte de las limitaciones asociadas a estas metodologías. A diferencia de la edición genómica, la regulación programada de la expresión génica a través del sistema CRISPRa plantea la posibilidad de generar variedades resistentes a plagas y enfermedades agrícolas sin introducir alteraciones genómicas irreversibles, tales como aquellas derivadas del fitomejoramiento tradicional, la transgénesis o la edición de genes S y R a través de nucleasas programables. En especial, a medida que se revela progresivamente el papel de la metilación del ADN y las PTHMs en el control de la expresión génica, la modificación dirigida de marcas epigenéticas podría implementarse como un método de mejoramiento (epi)genético, en el que el posicionamiento sintético de marcas como la H3K4me3 —importantes en la memoria celular y en el establecimiento de un estado transcripcional “permisivo”— en las regiones promotoras o codificantes de genes endógenos vinculados a la defensa en plantas, podría conducir al desarrollo de cultivos agrícolas con respuestas inmunitarias energéticamente más eficientes, así como mejorar la comprensión de los mecanismos epigenéticos implicados en el establecimiento y función de los medios de defensa. Estudios in vivo sobre la edición epigenética en plantas, basados en dCas9, son particularmente promisorios, aunque se encuentran lentamente en aumento.
Foto de portada de Freepik