Forskere har udviklet gensekventeringsmetoden, som kombinerer Next Generation Sequencing (NGS) og long-read sekventeringsteknologi. I modsætning til andre sekventeringsteknikker skaber CODEC fysisk forbundne kopier af de to DNA-strenge. Dermed kopieres begge strenge samtidig og analysens nøjagtighed øges, samtidig med at antallet af nødvendige amplifikationer reduceres.
Håndtering af spørgsmålene om genomsekventering
I de sidste fem årtier har genomsekventering været et felt i konstant udvikling. Forskere er kommet med forskellige sekvenseringsteknikker, herunder Next Generation Sequencing (NGS) og Duplex Sequencing, for at forbedre nøjagtigheden og tilgængeligheden af gensekventering. Begge metoder har dog udfordringer. Ved duplex-sekventering mærkes komplementære DNA-strenge (den enkelte ’duplex’) og giver nøjagtige aflæsninger, men metoden er omkostningsfuld. Ved NGS bliver metoden unøjagtig, når man undersøger sekvenser, der er for lange. Det betyder, at hel-genomsekventering (WGS) ved hjælp af NGS indeholder mange fejl, hvilket man kender som støj. For at imødekomme dette problem opdeles genomet ofte i mindre stykker, hvilket øger mængden af analysearbejde kraftigt.
En anden risiko ved sekventering er forekomsten af fejl under transskription. Når nukleotidsubstitutioner kun findes på én DNA-streng, kan det være svært at afgøre, om skaden opstod før analysen, eller om dette er en fejl som følge af polymerase-chain-reaction (PCR) analysen. Hvis den generelle fejlprocent er høj, kan det blive umuligt overhovedet at skelne mellem. En yderligere udfordring ved NGS er nøjagtig detektering af guanin- og cytosin-rige sekvenser. Det er altså nødvendigt med et stort antal amplifikationer for at have nok materiale til en nøjagtig sammenligning. Mutationer, DNA-skader og PCR-fejl vil kunne skelnes ved at sortere de komplementære strenge og sammenligne mængden af fejl, hvilket også kan øge både omkostningerne og tidsforbruget.
For at løse disse problemer samarbejdede en gruppe forskere fra University Grossman School of Medicine, New York, og University Hospitals Cleveland Medical Center, Ohio, med Cryos om at teste CODEC. I stedet for at lave separate kopier af hver streng skaber CODEC et enkelt molekyle af hele duplexet, der kan transskriberes. Hver amplifikation producerer altså nye molekyler, der består af komplementære strenge, som forbliver bundet. Dermed er det ikke nødvendigt at sortere DNA-par og det vil være tydeligt, hvilke strenge, der blev læst sammen. Metoden mindsker både antallet af nødvendige amplifikationer og øger analysens nøjagtighed.
Metode
For at teste virkningen af CODEC sammenlignet med forskellige andre WGS-metoder, analyserede forskerne de samme DNA-prøver med forskellige metoder. DNA-prøverne kom fra raske somatiske celler, brystkræftceller, sædceller og flydende biopsiprøver med stigende mikrosatellit ustabilitet (MSI). Resultaterne viste, at CODEC har en lignende fejlrate som Duplex Sequencing, den mest nøjagtige af andre teknikker, men prisen per DNA-base var ca. 100 gange lavere. Desuden kræver CODEC 230 gange færre læsninger sammenlignet med Duplex-sekventering. Antallet af nødvendige læsninger for at påvise præcise mutationer faldt med mindst 100 gange.
Resultater
CODEC formåede at detektere unikke mutationer, som ellers var gået tabt i støjen ved NGS. CODEC havde en lighed på 90-98% sammenlignet med Mutect2, der er den mest nøjagtige undersøgelse til påvisning af kræft. CODEC detekterede også prøver med lave niveauer af MSI ved et fald på 290 gange i fejlrater sammenlignet med standard NGS. Disse resultater tyder på, at CODEC er en meget nøjagtig og omkostningseffektiv teknik til WGS.
Det er dog vigtigt at bemærke, at CODEC stadig har unøjagtigheder og endnu ikke er et perfekt værktøj. Der er stadig plads til forbedringer, men i øjeblikket er CODEC teknikken med den bedste omkostningsværdi for WGS.
Resultaterne i dette studie muliggør en ny retning for udviklingen af gensekventeringsteknikker, da CODEC er yderst effektiv og er et omkostnings- og tidseffektivt alternativ til traditionelle sekventeringsmetoder. Evnen til nøjagtigt at analysere genetisk materiale er brugbar i flere brancher, herunder sundheds- og miljøvidenskab.