La régulation massive ou fine de l'expression génique est une composante essentielle de l’arsenal des voies de contrôle du développement des plantes et de réponses aux stresses environnementaux. Parmi les nombreux facteurs moléculaires impliqués dans ces différents mécanismes les ARN non codants (ARNnc) représentent une part importante du transcriptome des cellules végétales qu’il est important de bien caractériser. Les ARNnc sont définis par leurs tailles et référencés en 2 catégories :
-les petits ARN (18−30 nt)
-les longs ARNnc (31 à > 200 nt)
Les petits ARN jouent des rôles prépondérants en tant que régulateurs transcriptionnels ou post-transcriptionnels et le modèle « plante » a joué un rôle majeur dans la découverte des petits ARNs ainsi que dans l’élucidation de leurs modes d’action. Chez les plantes, les petits ARNnc ont des tailles comprises entre 20 et 30 nucléotides (nt) et jouent un rôle important dans les mécanismes de régulation du transcriptome. On distingue deux grandes catégories : les micro-ARNs (miRNAs) et les petits ARNs interférents (siARNs pour small interfering ARNs). Ils répriment l’expression de leurs gènes cibles selon deux mécanismes, appelés Transcriptional Gene Silencing (TGS) et Post-Transcriptional Gene Silencing (PTGS). Ces deux mécanismes dépendent de la complémentarité entre la séquence du petit ARN et celle de sa cible. Lors du TGS, l’inactivation génique est liée à des modifications épigénétiques au niveau du locus du gène cible (en général son promoteur), le rendant moins accessible à la machinerie de transcription. Le mécanisme épigénétique mis en œuvre est appelé « méthylation dépendante de l’ARN » (RdDM, pour RNA dependent DNA Methylation en anglais) et se retrouve essentiellement lié à l’inactivation des éléments transposables. Le PTGS se caractérise quant à lui par une dégradation ou une séquestration du transcrit du gène cible, empêchant sa traduction. Le TGS est essentiellement médié par les siARNs de 24 nucléotides et le PTGS par les miARNs et des siARNs de 21 nt. La synthèse des petits ARNs nécessite le clivage d’un ARN double brin précurseur par des ribonucléases de type III (RNases III), appelées DICER chez les animaux et DICER-LIKE (DCL) chez les plantes.
Lorsque les génomes nucléaires eucaryotes ont été séquencés, la proportion du génome reconnu comme gènes codant pour une protéine (mRNA) s'est révélée largement minoritaire. Des technologies d'analyse de transcriptome à haut débit ont révélé une transcription étendue dans les régions intergéniques et, chez Arabidopsis, on estime maintenant que jusqu'à 70-90% du génome est transcrit à un moment donné au cours du développement ou en réponse à un stress environnemental. Les molécules d'ARNnc comprennent l'ARN structural et domestique (ARN ribosomal, ARNt, petit ARN nucléolaire, petit ARN nucléaire) ainsi qu'une classe importante et hétérogène d'ARN régulateurs. Plus récemment, des études sur les plantes et les animaux ont attiré l'attention sur de longs ARN non codants (lncRNA) dont la taille dépasse généralement les 200 nt. Ceux-ci peuvent être sous-classés en fonction de leur origine génomique et / ou de leur orientation par rapport aux transcrits codants voisins. Les lncRNA sont transcrits à partir de régions intergéniques ou introniques. Leurs rôles dans le noyau, en particulier sur la régulation en cis de la transcription des locus voisins, ont été activement explorés chez les animaux ainsi que chez les plantes. Une idée émergente est que les lncRNA peuvent fonctionner dans le remodelage de la chromatine en interagissant avec des complexes de modification de la chromatine impliqués dans l’inactivation génique, tels que les complexes répressifs Polycomb 1 et 2 (PRC1, PRC2). Des exemples dans les plantes incluent l'ARNnc COLDAIR régulé par la vernalisation, qui interviennent dans le dépôt de la marque répressive de la chromatine, H3K27me3 au gène répresseur floral FLOWERING LOCUS C. Récemment, il a été rapporté que l'lncRNA APOLO contrôle la dynamique d'une boucle de la chromatine pour réguler l'activité du promoteur du gène PINOID voisin, un régulateur majeur du transport de l’auxine.
En plus des lncRNA intergéniques ou introniques, les transcrits antisens naturels (NAT) sont des lncARN qui chevauchent les mRNAs. Ceux-ci proviennent du brin inverse des régions codant les sens (protéines) (cis-NAT) ou de locus génomiques distincts (trans-NAT) et sont un component majeur du transcriptome (Saccharomyces cerevisiae, 27% des locus génomiques ; Drosophila melanogaster, 16,8% ; souris, 72% ; humain, 70%). Une analyse récente du transcriptome d'Arabidopsis provenant de multiples tissus et conditions environnementales a permis de trouver 33 805 paires de transcrits sens-antisens (70% des ARNm annotés). Il a été montré que les NAT utilisent divers mécanismes pour réguler l'expression des transcrits sens au niveau transcriptionnel ou post-transcriptionnel. Au niveau transcriptionnel, le remodelage de la chromatine sur les loci cibles est apparu comme un mode d'action important. Le NAT pourrait servir d'échafaudage fournissant une spécificité de séquence aux complexes contenant les enzymes modifiant les histones. Chez les mammifères, Xist est le premier exemple et un modèle majeur de ce mécanisme d’action.
Enfin, de nouvelles catégories d’ARNnc ont été identifiés comme nouveaux produits du « processing » des molécules d’ARN connues. Par exemple, des petits ARN dérivant d’ARN de transfert (les tRFs) ou des ARNnc circulaires liés aux réactions de l’épissage des mRNAs pourrais jouer aussi des rôles dans la régulation de l’expression génique via des modifications de la structure de la chromatine. Bien que la liste des ARNnc ait été étoffée il reste de nombreux points à éclaircir afin de comprendre leurs modes d’action et leurs rôles. Il est aussi important de considérer qu’une proportion des lncRNA pourraient être traduits en petits peptides dans le cytoplasme, un domaine qui est aussi en plein essor et qu’il est crucial de considérer.
L’axe thématique « Fonctions des ANRnc » s’attachera à décrypter les mécanismes moléculaires de biogénèse et les modes d’action des ARNnc liés aux fonctions nucléaires et de la régulation épigénétique de l’expression de gènes. La combinaison d’approches génomiques, incluant le développement d’outils bio-informatiques, génétiques et biochimiques permettra d’améliorer nos connaissances sur les fonctions des ARNnc dans les régulations épigénétiques chez les organismes photosynthétiques.
Identification d’ARNnc
Les nombreuses données de séquençage à haut débit disponibles et également produites lors de ce GDR permettront de recenser, de caractériser des nouvelles populations d’ARNnc dans des plantes modèles mais aussi dans des plantes à intérêt agronomique. Un effort particulier sera dédié à l’analyse des profils d’ARNnc dans différentes conditions environnementales et à différents stades développementaux, notamment en conditions de changement épigénétiques caractérisés (vernalisation, croissance) en se focalisant sur les ARNnc liés à des régulation épigénétiques.
L’amélioration des outils bio-informatique sera encouragée afin d’augmenter les capacités et la justesse d’analyse des populations d’ARNnc ainsi que la prédiction de leurs cibles. A terme, il est raisonnable d’envisager que ces efforts permettront de développer des outils facilitant des analyses grande échelle et du « machine learning » pour la modélisation de mécanismes moléculaires.
Biogénèse et mode d’action des ARNnc
Bien que les voies de biogénèse des petits ARNnc aient été bien décrites, il reste encore des efforts à accomplir pour mieux comprendre les mécanismes moléculaires régulant leurs modes de biogénèse afin de répondre aux questions suivantes :
Ou sont produits les ARNnc, notamment dans le noyau ?
Comment leur biogénèse est régulée ?
Comment et/où sont-ils pris en charge par les protéines effectrices ?
Est-ce qu’une partie des lncRNAs peuvent coder pour des petits peptides ?
De plus, des voies non conventionnelles de biogénèse d’ARNnc ont été identifiées suggérant fortement que des interconnexions complexes existent entre les facteurs des différentes voies de biogénèse et de mode d’action des ARNnc. Par conséquent, un objectif particulier sera de caractériser ces mécanismes et leurs rôles biologiques. L’identification de populations particulières d’ARNnc induites dans des conditions de stress ou spécifique d’un certains types de tissus/stades développementaux serviront de base à cette étude.
Dynamique des ANRnc et des effecteurs des ARNnc
En lien avec la caractérisation des voies de biogénèse et le mode d’action des ARNnc il convient d’étudier la dynamique et le trafic des ARNnc et de leurs effecteurs au sein de la cellule et/ou de l’organisme photosynthétique. En effet, il a été démontré que les ARNnc peuvent agir à longue distance, être produits dans des organites (chloroplastes et mitochondries) et agir dans le cytoplasme ou le noyau. Les mécanismes moléculaires régulant leur dynamique seront donc étudiés en relation avec leur rôle biologique.
Les effecteurs des ARNnc (par exemple les protéines ARGONAUTES) font l’objet d’une régulation fine afin d’assurer le contrôle de leur mode d’action par des modifications post-traductionnelles ou des associations avec des facteurs spécifiques. Les acteurs de l’axe thématique « fonctions des ARNnc » contribueront à identifier les mécanismes régulant la compartimentation cellulaire, la dynamique d’action et le contrôle de l’homéostasie des effecteurs des ARNnc, l’interaction des ARNnc avec la machinerie épigénétique et la structure de la chromatine. Plusieurs méthodologies permettent l’identification des partenaires des ARNnc afin de mieux cerner leur impact sur les acteurs de la régulation chromatinienne (boucles chromatiniennes, PRC1/PRC2 complexes et autres)