lncRNA

LncRNA (lange niet-coderende RNA) is een type RNA, doorgaans gedefinieerd als transcripten met meer dan 200 nucleotiden die niet in eiwitten worden vertaald.[2] Deze willekeurige limiet onderscheidt lncRNA's van kleine niet-coderende RNAs, zoals microRNA's (miRNA's), kleine interfererende RNA's (siRNA's), Piwi-interacterende RNA's (piRNA's), kleine nucleolaire RNA's (snoRNA's) en andere korte RNA's.[3] Gegeven dat sommige lncRNA's het potentieel hebben om voor kleine eiwitten of micropeptiden te coderen, is de nieuwste definitie van lncRNA een klasse van RNA-moleculen van meer dan 200 nucleotiden die geen of beperkte codeercapaciteit hebben.[4] Lang tussenliggende/intergene niet-coderende RNA's (lincRNA's) zijn sequenties van lncRNA die de eiwitcoderende genen niet overlappen.[5]
LncRNA's omvatten intergene lincRNA's, intronische ncRNA's en sense en antisense lncRNA's, waarbij elk type verschillende genomische posities vertoont in relatie tot genen en exons.[1][3] Een intergene regio is een stuk DNA-sequenties dat zich tussen de genen bevindt.
Hoeveelheid voorkomende lncRNA's
Bij veel soorten worden lange niet-coderende transcripties aangetroffen. Grootschalige complementair DNA (cDNA) sequencingprojecten zoals FANTOM laten de complexiteit van deze transcripten bij de mens zien.[6] Het FANTOM3-project identificeerde ongeveer 35.000 niet-coderende transcripten die veel karakteristieken van messenger-RNAs hebben, waaronder 5'-capping, splicing en polyadenylatie, maar hebben weinig of geen open leesraam (ORF).[6] Dit getal vertegenwoordigt een conservatieve lage schatting, omdat veel enkelgene-transcripties en niet-polyadenyleerde transcripten niet worden meegerekend (tiling array gegevens tonen aan dat meer dan 40% van de transcripties niet-gepolyadenyleerd zijn. Een tiling array is een subtype van microarray chips)[7] Het identificeren van ncRNA's binnen deze cDNA-bibliotheken is een uitdaging, omdat het moeilijk kan zijn om eiwitcoderende transcripten te onderscheiden van niet-coderende transcripten. Via meerdere onderzoeken is gesuggereerd dat testis[8] en zenuwweefsels van elk weefsel-type de grootste hoeveelheid lncRNA's tot expressie brengen.[9] Met behulp van FANTOM5 zijn 27.919 lncRNA's geïdentificeerd in verschillende menselijke herkomsten.[10]
Kwantitatief gezien vertonen lncRNA's een circa 10 maal lagere dichtheid dan mRNA's,[11][12] wat wordt verklaard door hogere cel-tot-celvariatie van expressieniveaus van lncRNA-genen in de individuele cellen, vergeleken met eiwitcoderende genen.[13] Over het algemeen wordt de meerderheid (~78%) van de lncRNA's gekarakteriseerd als weefsel-specifiek, in tegenstelling tot slechts zo'n 19% van de mRNA's.[11] Slechts 3,6% van de menselijke lncRNA-genen komt tot expressie in verschillende biologische contexten en 34% van de lncRNA-genen wordt op hoog niveau tot expressie gebracht (top 25% van zowel lncRNA's als mRNA's) in ten minste één biologische context.[14] Naast een hogere weefselspecificiteit worden lncRNA's gekenmerkt door een hoger ontwikkelingsstadium specificiteit,[15] en celsubtype-specificiteit in weefsels zoals de menselijke neocortex[16] en andere delen van de hersenen, die de juiste ontwikkeling en functie van de hersenen reguleren.[17] In 2022 onthulde een uitgebreide integratie van lncRNA's uit bestaande databases dat er 95.243 lncRNA-genen en 323.950 transcripten bij mensen voorkomen.[18]
In vergelijking met zoogdieren hebben relatief weinig onderzoeken zich gericht op het voorkomen van lncRNA's in planten. Een uitgebreid onderzoek bij 37 hogere plantensoorten en zes algen identificeerde echter zo'n 200.000 niet-coderende transcripten met behulp van een in-silico-benadering.[19] De Green Non-Coding Database (GreeNC) is een opslagplaats van lncRNA's van planten.
Genomische organisatie
In 2005 werd het landschap van het genoom van zoogdieren beschreven als talrijke 'foci' van transcriptie die gescheiden zijn door lange stukken intergene ruimte.[6] Terwijl sommige lncRNA's zich binnen de intergene stukken bevinden, is de meerderheid overlappende sense en antisense transcripten die vaak eiwitcoderende genen bevatten,[20] die een complexe hiërarchie van overlappende isovormen vormen.[21] Genomische sequenties binnen deze transcriptionele foci worden vaak gedeeld binnen een aantal coderende en niet-coderende transcripties in de sense- en antisense-richtingen[22] Bijvoorbeeld 3012 van de 8961 cDNA's die eerder waren beschreven als afgekorte coderende sequenties binnen FANTOM2 werden later aangeduid als echte ncRNA-varianten van eiwitcoderende cDNA's.[6] Terwijl de overvloed en het behoud van deze foci suggereren dat ze biologische relevantie hebben, frusteert de complexiteit van deze foci een gemakkelijke evaluatie.
Het GENCODE-consortium heeft een uitgebreide reeks menselijke lncRNA-annotaties en hun genomic organisatie, modificaties, cellulaire locaties en weefselexpressieprofielen verzameld en geanalyseerd.[9] Uit hun analyse blijkt dat menselijke lncRNA's een voorkeur vertonen voor twee exontranscripties.[9]
- ↑ a b (en) Fernandes, J.C.R. et al. (17 februari 2019). Long Non-Coding RNAs in the Regulation of Gene Expression: Physiology and Disease. Non-Coding RNA 5 (1). PMID 30781588. PMC 6468922. DOI: 10.3390/ncrna5010017.
- ↑ (en) Perkel, J.M. (june 2013). Visiting "noncodarnia". BioTechniques 54 (6): 301, 303–4. PMID 23750541. DOI: 10.2144/000114037. “"We're calling long noncoding RNAs a class, when actually the only definition is that they are longer than 200 bp," says Ana Marques, a Research Fellow at the University of Oxford who uses evolutionary approaches to understand lncRNA function.”.
- ↑ a b (en) Ma, L., Bajic, V.B., Zhang Z. (15 april 2013). On the classification of long non-coding RNAs. RNA Biology 10 (6): 925–933. PMID 23696037. PMC 4111732. DOI: 10.4161/rna.24604.
- ↑ (en) Ma, L., Zhang Z. (5 mei 2023). The contribution of databases towards understanding the universe of long non-coding RNAs. Nature Reviews. Molecular Cell Biology 24 (9): 601–602. ISSN: 1471-0080. PMID 37147495. DOI: 10.1038/s41580-023-00612-z.
- ↑ (en) Ransohoff, J.D., Wei, Y., Khavari, P.A. (15 november 2017). The functions and unique features of long intergenic non-coding RNA. Nature Reviews. Molecular Cell Biology 19 (3): 143–157. PMID 29138516. PMC 5889127. DOI: 10.1038/nrm.2017.104.
- ↑ a b c d (en) Carninci, P. et al. (2 september 2005). The transcriptional landscape of the mammalian genome. Science 309 (5740): 1559–1563. PMID 16141072. DOI: 10.1126/science.1112014.
- ↑ (en) Cheng, J. et al. (20 mei 2005). Transcriptional maps of 10 human chromosomes at 5-nucleotide resolution. Science 308 (5725): 1149–1154. PMID 15790807. DOI: 10.1126/science.1108625.
- ↑ (en) Necsulea, A. et al. (19 januari 2014). The evolution of lncRNA repertoires and expression patterns in tetrapods. Nature 505 (7485): 635–640. PMID 24463510. DOI: 10.1038/nature12943.
- ↑ a b c (en) Derrien, T. et al. (september 2012). The GENCODE v7 catalog of human long noncoding RNAs: analysis of their gene structure, evolution, and expression. Genome Research 22 (9): 1775–1789. PMID 22955988. PMC 3431493. DOI: 10.1101/gr.132159.111.
- ↑ (en) Hon, C.C. et al. (1 maart 2017). An atlas of human long non-coding RNAs with accurate 5′ ends. Nature 543 (7644): 199–204. PMID 28241135. PMC 6857182. DOI: 10.1038/nature21374.
- ↑ a b (en) Cabili, M.N. et al. (september 2011). Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses. Genes & Development 25 (18): 1915–1927. PMID 21890647. PMC 3185964. DOI: 10.1101/gad.17446611.
- ↑ (en) Ravasi, T. et al. (januari 2006). Experimental validation of the regulated expression of large numbers of non-coding RNAs from the mouse genome. Genome Research 16 (1): 11–19. PMID 16344565. PMC 1356124. DOI: 10.1101/gr.4200206.
- ↑ (en) Yunusov, D. et al. (8 september 2016). HIPSTR and thousands of lncRNAs are heterogeneously expressed in human embryos, primordial germ cells and stable cell lines. Scientific Reports 6: 32753. PMID 27605307. PMC 5015059. DOI: 10.1038/srep32753.
- ↑ Li, Z. et al. (12 oktober 2020). LncExpDB: an expression database of human long non-coding RNAs. Nucleic Acids Research 49 (D1): D962–D968. ISSN: 1362-4962. PMID 33045751. PMC 7778919. DOI: 10.1093/nar/gkaa850.
- ↑ (en) Yan, L. et al. (11 augustus 2013). Single-cell RNA-Seq profiling of human preimplantation embryos and embryonic stem cells. Nature Structural & Molecular Biology 20 (9): 1131–1139. PMID 23934149. DOI: 10.1038/nsmb.2660.
- ↑ (en) Liu, S.J. et al. (14 april 2016). Single-cell analysis of long non-coding RNAs in the developing human neocortex. Genome Biology 17: 67. PMID 27081004. PMC 4831157. DOI: 10.1186/s13059-016-0932-1.
- ↑ (en) Aliperti, V., Skonieczna, J., Cerase, A. (17 juni 2021). Long Non-Coding RNA (lncRNA) Roles in Cell Biology, Neurodevelopment and Neurological Disorders. Non-Coding RNA 7 (2): 36. PMID 34204536. PMC 8293397. DOI: 10.3390/ncrna7020036.
- ↑ (en) Li, Zhao et al. (4 november 2022). LncBook 2.0: integrating human long non-coding RNAs with multi-omics annotations. Nucleic Acids Research 51 (D1): D186–D191. ISSN: 1362-4962. PMID 36330950. PMC 9825513. DOI: 10.1093/nar/gkac999.
- ↑ (en) Paytuví Gallart, A. et al. (17 november 2015). GREENC: a Wiki-based database of plant lncRNAs. Nucleic Acids Research 44 (D1): D1161–6. PMID 26578586. PMC 4702861. DOI: 10.1093/nar/gkv1215.
- ↑ (en) Kapranov, P. et al. (8 juni 2007). RNA maps reveal new RNA classes and a possible function for pervasive transcription. Science 316 (5830): 1484–1488. PMID 17510325. DOI: 10.1126/science.1138341.
- ↑ (en) Kapranov, P., Willingham, A.T., Gingeras, T.R. (8 mei 2007). Genome-wide transcription and the implications for genomic organization. Nature Reviews Genetics 8 (6): 413–423. PMID 17486121. DOI: 10.1038/nrg2083.
- ↑ (en) Birney, E. et al. (14 juni 2007). Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. Nature 447 (7146): 799–816. PMID 17571346. PMC 2212820. DOI: 10.1038/nature05874.