Sekvensering

Hoppa till: navigering, sök

Till innehÄllsförteckningen för Referensmetodik:MolekylÀrbiologisk diagnostik


Sekvensering

DNA-sekvensering Àr den process som anvÀnds för att med biokemiska metoder bestÀmma ordningen av baserna adenin, guanin, cytosin och tymin i DNA. Sekvensen utgör den Àrvda genetiska informationen och Àr dÀrför viktig bÄde i grundlÀggande forskning kring organismer, diagnostik, vid rÀttsmedicinska utredningar för att identifiera Àrftliga sjukdomar och vid epidemiologiska utredningar. Den snabba utvecklingen inom omrÄdet har möjliggjort storskaliga sekvenseringar av till exempel det mÀnskliga genomet. Med de nya sekvenseringsteknikerna fÄr man lÀngre och fler sekvenser med fÀrre fel pÄ kortare tid. Utvecklingen av enzymer, instrument och programvara pÄgÄr stÀndigt och de uppgifter pÄ kapacitet man uppger idag Àr förÄldrade inom kort.

Historik

Det första virusgenomet (EBV) sekvenserades 1984, första bakteriegenomet, frÄn Haemophilus influenzae 1995, jÀst 1996 och första helgenomsekvensen frÄn en mÀnniska 2007.

Under 1976-1977 utvecklade Maxam och Gilbert en DNA-sekvenseringsmetod baserad pÄ kemisk modifikation av DNA och efterföljande delning vid specifika baser. Metoden benÀmns ibland som kemisk sekvensering. PÄ grund av metodens komplexitet, omfattande anvÀndning av farliga kemikalier och svÄrigheter att anvÀnda den storskaligt anvÀndes denna metod endast under nÄgra Är.

Sekvensering med Dideoxy-metoden

Under tidsperiod 1975-1977 utvecklade Sanger en sekvenseringsmetod för enkelstrÀngat DNA. Huvudprincipen bakom Sangers metod Àr anvÀndandet av dideoxy-nukleotider som orsakar stopp i DNA-syntesen, se figur 18. PÄ 70- och 80-talen krÀvdes det att man framstÀllde enkelstrÀngat DNA innan sekvensering med dideoxy-metoden kunde utföras. Oftast klonade man in det fragment man skulle sekvensera i en bakteriofag (M13) som har bÄde en enkelstrÀngad och dubbelstrÀngad fas i sin replikationscykel. Man anvÀnde den dubbelstrÀngade DNA-formen för att klona in DNA-fragmentet. Sedan anrikade man den enkelstrÀngade formen för sekvenseringen. NÀr PCR-metoden introducerades i slutet av 80-talet blev det möjligt att pÄ ett enkelt sÀtt sekvensera med dideoxy-metoden. Med hjÀlp av PCR kan man amplifiera och analysera smÄ mÀngder av templat. Med hjÀlp av fÀrginmÀrkning av dideoxynukleotiderna separeras sekvenseringsprodukterna i kapillÀrer istÀllet för stora gelelektroforessystem som tidigare anvÀndes (figur 19). Med all metodutveckling kring templatframstÀllning, enzymer, fÀrginmÀrkning och gel/kapillÀrseparering kan man idag lÀsa mellan 500-1000 lÄnga fragment för upp till 384 prover samtidigt. Den ökande mÀngden sekvensdata har Àven krÀvt utveckling av dataprogrammen/mjukvaran för hantering av all sekvensinformation.


Figur 18. Skillnaden mellan deoxytymidintrifosfat (dTTP) och dideoxytymidintrifosfat (ddTTP, till höger i bilden) Àr avsaknaden av syret pÄ kol 3 i ribos. Ingen fortsatt DNA syntes kan ske frÄn dideoxynukleotider. Bild: Mia Brytting


Figur 19. Sekvensering, Sangers metod. DNA (templat) som ska sekvenseras blandas med en mindre mÀngd fluorofor (fÀrg)- inmÀrkta dideoxy-nukleotider (ddNTP: en fluorofor för varje ddATP, ddCTG, ddGTG samt ddTTP), vanliga trifosfatnukleotider, ett DNA-polymeras, en primer och dÀrefter startas PCR-programmet i en termocykler. Dideoxynukleotiderna Àr derivat av normala trifosfatnukleotider, och saknar bÄde OH-grupp pÄ 2'-kolet men Àven pÄ 3'-kolet. Eftersom dideoxynukleotiderna Àr fÀrre till antalet Àn de vanliga nukleotiderna Àr det högre sannolikhet att en vanlig nukleotid inkorporeras, men nÀr en dideoxy-nukleotid byggs in av DNA-polymeraset stoppas DNA-syntesen eftersom OH-grupp saknas pÄ 3'-kolet. Efter sekvenseringen har man en produkt som bestÄr av olika lÀngder. Genom att separera DNA-fragmenten beroende av deras lÀngd i en maskin som kan lÀsa av de olika fluoroforernas fÀrger kan DNA sekvensen lÀsas direkt. Bild: Mia Brytting

Pyrosekvensering

Tekniken utvecklades av en svensk grupp i slutet av 1990-talet. Metoden baseras pÄ reaktioner dÀr inbindandet av nukleotider till en komplementÀr DNA-strÀng ger upphov till en ljusreaktion, se figur 20. Ljuset mÀts via en fotometer. Ljusreaktionens intensitet Àr proportionerlig mot antalet inbundna nukleotider och eftersom endast "rÀtt" nukleotid kan binda in vid ett givet tillfÀlle kan man utlÀsa ordningsföljden. I början kunde man bara lÀsa 30-50 baser lÄnga sekvenser. Idag har tekniken utvecklats sÄ att 100 baser lÄnga sekvenser kan utlÀsas. Denna metod anvÀnds idag frÀmst för att studera specifika mutationer eller variationer inom en begrÀnsad region eller gen.


Figur 20. Pyrosekvensering. Metoden bygger pÄ att en kemisk ljusproducerande enzymatisk reaktion. Varje gÄng en av nukleotiderna binder in till den komplementÀra DNA-strÀngen utsÀnds en ljussignal som pÄvisas, vilket gör att man kan utlÀsa sekvensen i ett pyrogram (till höger i bilden). Bild: Mia Brytting

Andra sekvenseringsmetoder

Det pÄgÄr en stÀndig utveckling av andra sekvenseringstekniker Àn de som nÀmnts ovan. Reversibel termineringssekvensering samt ligasbaserad sekvensering beskrivs under Solexa respektive SOLiD-teknikerna. En alternativ sekvenseringsmetod Àr att anvÀnda diskriminerande prober vid realtids-PCR, vid denna teknik kan endast en nukleotidposition per gÄng studeras sk SNP (single nucleotide polymorphisms) - analys. Ytterligare metoder finns och beskrivs i följande referenser (4-9).


Shotgun-sekvensering

För större mĂ€ngder av DNA, sĂ„som ett helt genom, Ă€r andra metoder som till exempel ”shotgun”-sekvensering mer lĂ€mplig. Vid denna metodik klyver man det DNA som skall sekvenseras i bitar och parallellsekvenserar alla fragmenten. Genom att sammanstĂ€lla alla sekvenser med överlappande homologi kan lĂ„nga sekvensstrĂ€ngar fogas samman (se figur 21).

Figur 21. Shotgun sekvensering bygger pÄ sekvensering av flera fragment dÀr sekvensinformationen sammanfogas med hjÀlp överlappning av sekvenshomologin. Bild: Mia Brytting

Massiv parallellsekvensering

Genom att kombinera shotgun-tekniken och olika sekvenseringstekniker i stor skala har det idag blivit möjligt att sekvensera hela genom pĂ„ kort tid. I dagslĂ€get finns det flera olika system för massiv parallellsekvensering (ref 5, 7-9). I detta kapitel beskrivs de tre som har kommit lĂ€ngst (Ă„r 2009) i sin utveckling. Dessa tekniker kallas ibland för ”next generation sequencing”


GS FLX Titanium - 454 teknologi

  • 1. Extraktion av DNA/RNA som skall sekvenseras.
  • 2. Kemisk klyvning (nebulisering med kvĂ€vgas) av DNA/cDNA, behövs inte om det Ă€r korta (cirka 600-800 bp) PCR-fragment.
  • 3. Ligering av korta DNA-strĂ€ngar (adaptrar) A och/eller B (B adaptern Ă€r biotinylerad) till bĂ„da Ă€ndarna (5’ och 3’) av templat DNA.
  • 4. DNA-fragment med B adaptern binds till en magnetisk kula med streptavidin. Man strĂ€var efter att fĂ„ ett fragment per kula. För att erhĂ„lla bra resultat krĂ€vs en separat titreringsomgĂ„ng av templatet för att faststĂ€lla rĂ€tt förhĂ„llande mellan templat och kulor.
  • 5. DNA-fragment som saknar B adaptern tvĂ€ttas bort.
  • 6. Magnetkulorna blandas i en vatten-oljeemulsion.
  • 7. DNA-strĂ€ngar med A och B adaptrar amplifieras via PCR-teknik i vatten-oljeemulsionen.
  • 8. Emulsionen upplöses och kulorna placeras i en picotiterplatta, en kula per brunn. Till varje brunn tillsĂ€tts reaktionsmix för pyrosekvensering.
  • 9. Pyrosekvenseringsreaktionen avlĂ€ses med hjĂ€lp av en CCD kamera.

Efter 10-20 timmar (titreringssteget exkluderat) kan upp till 400 000 sekvenser om cirka 350-500 bp lÀngd avlÀsas. Detta innebÀr cirka 400-600 millioner baser vid en sekvenseringsomgÄng. Uppgradering av denna teknik pÄgÄr och snart kommer det att vara möjligt att erhÄlla sekvenser av en lÀngd kring 1000 bp. Idag tar hanteringen av all sekvenseringsdata lÀngre tid Àn sjÀlva sekvenseringen.



Figur 22. Sekvensering med 454-tekniken Bild: Roche, publicerad med företagets godkÀnnande

Molekyl22A.jpg
Molekyl22B.jpg
Molekyl22C.jpg
Molekyl22D.jpg

Solexa

  • 1. Extraktion av DNA/RNA som skall sekvenseras
  • 2. Klyvning (sonikering alternativt nebulisering med kvĂ€vgas) av DNA/cDNA.
  • 3. Ligering av korta DNA-strĂ€ngar (adaptrar) A och/eller B till bĂ„da Ă€ndarna (5’ och 3’) av fragmenterat templat DNA.
  • 4. Templatet binds till ytan i en flödeskammare med hjĂ€lp av hybridiseringsreaktioner (Ă„tta olika prover kan analyseras samtidigt). I denna kammare finns redan ett stort antal av A och B adaptrarna bundna.
  • 5. Genom homologi mellan adaptern pĂ„ templatet och de som sitter i kammaren kommer nu adaptersekvenserna att binda till varandra (”sĂ„ att det bildas en brygga (bridge)”). Detta tillĂ„ter att enskilda molekyler kan ampliferas via PCR innan sekvenseringsreaktionerna.
  • 6. Amplifieringen av templaten sker i kammaren. De nybildade fragmenten binds in i kammaren i nĂ€rheten av ursprungstemplatet. Detta kallas ibland för bridge-PCR. Detta gör att det finns flera smĂ„ regioner i kammaren med amplifierat DNA.
  • 7. Sevensering sker sedan med reversibel termineringssekvensering. Genom att tillsĂ€tta en mix av DNA-polymeras och de fyra nukleotiderna (alla med specifik fluorofor) kan sekvenseringen börja. Nukleotiderna har en stoppmolekyl vilket gör att endast en nukleotid kan inkorporeras per cykel. Med hjĂ€lp av laserkamera avlĂ€ses vilken nukleotid (beroende pĂ„ fĂ€rg) samt i vilken region i kammaren som reaktion sker. Detta gör det möjligt att avlĂ€sa sekvensdata frĂ„n flera olika templat pĂ„ samma gĂ„ng. Genom att ta bort stoppmolekylen och upprepa sekvenseringscykeln kan nĂ€sta nukleotid avlĂ€sas. Med denna teknik kan cirka 40*10^6 sekvenser a’ 30-50 baser avlĂ€sas vilket innebĂ€r 1.6*10^6 baser vid en sekvenseringsomgĂ„ng. En hel analysomgĂ„ng (exklusive databearbetningen) tar cirka tre dagar.


Figur 23. Sekvensering enligt solexatekniken. Bild: Illumina, publicerad med företagets godkÀnnade.

SOLiD

  • 1. Extraktion av DNA/RNA som skall sekvenseras.
  • 2. Mekanisk klyvning (sonikering) av DNA/cDNA.
  • 3. Separation av fragmenten via gelelektrofores. Fragment motsvarande en bestĂ€md lĂ€ngd (ca 100 bp vid ett fragmentbibliotek och lĂ€ngre fragment vid t.ex genomisk kartlĂ€ggning) skĂ€rs ut. Rening av fragmenten frĂ„n gelen.
  • 4. Korta DNA-strĂ€ngar (adaptrar) A och B ligeras till bĂ„da Ă€ndarna (5’ och 3’) pĂ„ templat DNA.
  • 5. PCR-amplifiering av templatet med hjĂ€lp av primers riktade mot adapterregionerna. Genom att begrĂ€nsa primerkoncentrationen för A-regionen och tillsĂ€tta magnetiska kulor som har den primern fĂ„r man amplifiering av DNA frĂ„n primer kopplade till magnetkulorna. Man försöker uppnĂ„ ett 1:1 förhĂ„llande mellan kulor och templatet.
  • 6. PCR-amplifieringen sker i en vatten-oljeemulsion.
  • 7. Emulsionen bryts nĂ€r PCRen Ă€r fĂ€rdig genom att butanol tillsĂ€tts och oljan tvĂ€ttas bort.
  • 8. Kulor med enkelstrĂ€ngat DNA som har amplifierats frĂ„n den magnetbundna primern anrikas. De tvĂ€ttade kulorna med DNA blandas med en lösning med större polystyrenkulor vilka har en linker pĂ„ ytan som kan binda B-adaptorn frĂ„n DNA-kulan. Denna ”kulmix” lĂ€ggs ovanpĂ„ en glycerollösning och centrifugeras. Efter centrifugering hamnar kulor utan DNA i en pellet och kulor som Ă€r bundna till polystyren kulan ligger kvar i en fas ovanpĂ„ glycerolen. Dessa kulor tvĂ€ttas och DNA denatureras sĂ„ det slĂ€pper frĂ„n polystyrenkulan.
  • 9. 3’ Ă€ndan av dessa strĂ€ngar modifieras med terminal transferas sĂ„ att de binder kovalent till glas. Kulorna deponeras pĂ„ ett glas som kan delas in i ett, fyra eller Ă„tta fĂ€lt.
  • 10. DNA sekvenseras med ligassekvensering. Ofta anvĂ€nds 5 olika primers som binder olika lĂ„ngt ut frĂ„n adaptorn. Proben som ligeras till primern har fĂ€rgmolekylen pĂ„ sig. Proben Ă€r en oktamer med enbart tvĂ„ unika baser, 256 olika prober per fĂ€rg, totalt 1024 olika prober finns i probemixen (4^5). NĂ€r proben bundit lĂ€ses fĂ€rgen av frĂ„n varje kula i fyra olika kanaler. Efter detta klyvs 5’ Ă€nden bort pĂ„ proben sĂ„ nĂ€sta probe kan ligeras. NĂ€r signal frĂ„n sista proben detekterats rensas templatet och nĂ€sta primer kan binda in ett steg före föregĂ„ende primers bindningsstĂ€lle. Vid sekvensering av fragmentbibliotek lĂ€ses 50 baser med start frĂ„n adaptor. Fragmentet kan vara av olika lĂ€ngd men enbart 25-50 baser sekvenseras. Under vĂ„ren 2009 kommer en uppgradering till SOLiD med möjlighet till lĂ€sning av 75 baser.
  • 11. Att sekvensera ett fragmentbibliotek tar idag cirka 3-5 dagar. Man kan dĂ„ erhĂ„lla cirka 100*10^9 baser vid en sekvenseringsomgĂ„ng. Idag tar hanteringen av all sekvenseringsdata lĂ€ngst tid.


Figur 24. . Sekvensering enligt SOLiD-teknik. Texten i figuren beskriver de olika stegen. Bild: Applied Biosystems en del av Life Technologies Group, publicerad med företagets godkĂ€nnande. FÖR LÄSBAR BILD, KLICKA PÅ BILDEN, DU KOMMER DÅ TILL FILSIDAN DÄR DU ÅTER KAN KLICKA PÅ BILDEN TILL LÄSBAR FÖRSTORINGSGRAD

REFERENSER

  • 1 Maxam AM, Gilbert W. A new method for sequencing DNA. Proc. Natl. Acad. Sci. U.S.A. 1977;74:560-4.
  • 2 Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. Proceedings of the National Academy of Sciences USA 1977;74: 5463-5467.
  • 3 Nyren P. Enzymatic method for continuous monitoring of DNA polymerase activity. Anal. Biochem. 1987;167:235-8.
  • 4 Ahmadian A, Ehn M, Hober S. 2006. Pyrosequencing: History, biochemistry and future. Clinica. Chimica. Acta. 2006;363(1-2): 83-94.
  • 5 Shendure JA, Porreca GJ, Church GM. Overview of DNA sequencing strategies. Current Protocols in Mol. Biol. 2008; 7.1.1-11.
  • 6 Ausubel FM, Albright LM, Ju J. DNA sequencing. Current Protocols in Mol. Biol. 2008; 7.0.1-15.
  • 7 Metzker ML. Emerging technologies in DNA sequencing. Genome Res. 2005;15(12):1767-76.
  • 8 Ziebolz B, Droege M. Toward a new era in sequencing. Biotechnol Annu Rev. 2007;13:1-26.
  • 9 Bentley DR. Whole-genome re-sequencing. Curr Opin Genet Dev. 2006;16(6):545-52.
  • 10 Venter JC, Smith HO, Hood L. A new strategy for genome sequencing. Nature 1996; 381, 364-6.