Od editace genů přes stanovení proteinové struktury až po kvantové výpočty, zde je sedm technologií, které pravděpodobně budou mít dopad na vědu v příštím roce.
Úplně hotové genomy
Zhruba jedna desetina lidského genomu zůstala nezmapovaná, když výzkumníci genomiky Karen Miga z Kalifornské univerzity v Santa Cruz a Adam Phillippy z National Human Genome Research Institute v Bethesdě v Marylandu spustil konsorcium Telomere-to-Telomere (T2T) v roce 2019. Nyní toto číslo kleslo na nulu. V předtisku zveřejněném v květnu loňského roku konsorcium oznámilo první end-to-end sekvenci lidského genomu, přidalo téměř 200 milionů nových párů bází k široce používané sekvenci lidského konsenzuálního genomu známé jako GRCh38 a napsalo závěrečnou kapitolu projekt lidského genomu1.
GRCh38, poprvé vydaný v roce 2013, byl cenným nástrojem – lešením, na kterém lze mapovat čtení sekvencí. Ale je prošpikovaný dírami. Je to z velké části proto, že široce používaná technologie sekvenování vyvinutá společností Illumina v San Diegu v Kalifornii poskytuje údaje, které jsou přesné, ale krátké. Nejsou dostatečně dlouhé, aby jednoznačně zmapovaly vysoce repetitivní genomové sekvence, včetně telomer, které zakrývají konce chromozomů, a centromer, které koordinují dělení nově replikované DNA během buněčného dělení.
Technologie sekvenování s dlouhým čtením se ukázaly jako zásadní změna. Tyto technologie vyvinuté společnostmi Pacific Biosciences v Menlo Park v Kalifornii a Oxford Nanopore Technologies (ONT) v Oxfordu ve Velké Británii mohou sekvenovat desítky nebo dokonce stovky tisíc bází v jediném čtení, ale – alespoň na začátku – ne bez chyb. . V době, kdy tým T2T v roce 2020 zrekonstruoval2,3 své první jednotlivé chromozomy – X a 8 – však sekvenování Pacific Biosciences mělo pokročila do té míry, že vědci T2T mohli detekovat drobné odchylky v dlouhých úsecích opakovaných sekvencí. Díky těmto jemným „otiskům prstů“ byly dlouhé opakující se segmenty chromozomů ovladatelné a zbytek genomu se rychle srovnal. Platforma ONT také zachycuje mnoho modifikací DNA, které modulují genovou expresi, a T2T dokázal zmapovat i tyto ‚epigenetické značky‘ v celém genomu4.
Uzavření kompletního lidského genomu
Vyřešený genom T2T pocházel z buněčné linie, která obsahuje dvě identické sady chromozomů. Normální diploidní lidské genomy obsahují dvě verze každého chromozomu a vědci nyní pracují na strategiích „fázování“, které mohou s jistotou přiřadit každou sekvenci příslušné kopii chromozomu. „Již dostáváme docela fenomenální postupné montáže,“ říká Miga.
Tato diploidní montážní práce se provádí ve spolupráci s partnerskou organizací T2T, Human Pangenome Reference Consortium, která usiluje o vytvoření reprezentativnější mapy genomu na základě stovek dárců z celého světa. „Naším cílem je zachytit v průměru 97 % lidské alelické diverzity,“ říká Erich Jarvis, jeden z hlavních výzkumníků konsorcia a genetik na Rockefellerově univerzitě v New Yorku. Jako předseda projektu Genomes Vertebrate Jarvis také doufá, že využije tyto schopnosti kompletního sestavení genomu k vytvoření úplných sekvencí pro každý druh obratlovců na Zemi. "Myslím, že během příštích 10 let budeme běžně provádět genomy telomery a telomery," říká.
Řešení proteinové struktury
Struktura určuje funkci. Ale to může být těžké změřit. Velké experimentální a výpočetní pokroky v posledních dvou letech poskytly výzkumníkům doplňkové nástroje pro určování proteinových struktur s bezprecedentní rychlostí a rozlišením.
Umělá inteligence podporuje předpovědi skládání bílkovin
Algoritmus předpovědi struktury AlphaFold2, vyvinutý dceřinou společností Alphabet, DeepMind v Londýně, spoléhá na strategie „hlubokého učení“ k extrapolaci tvaru složeného proteinu z jeho aminokyselinové sekvence5. Po rozhodujícím vítězství v soutěži Critical Assessment of protein Structure Prediction v roce 2020, ve které počítačoví biologové testují své algoritmy pro predikci struktury přímo proti sobě, reputace AlphaFold2 – a její přijetí – prudce vzrostly. „U některých struktur jsou předpovědi téměř děsivě dobré,“ říká Janet Thornton, vedoucí vědecká pracovnice a bývalá ředitelka Evropského bioinformatického institutu v Hinxtonu ve Velké Británii. Od svého zveřejnění v červenci loňského roku byl AlphaFold2 aplikován na proteomy, aby se určily struktury všech proteinů exprimovaných u lidí6 a ve 20 modelových organismech (viz Nature 595, 635; 2021), stejně jako téměř 440 000 proteinů v databázi Swiss-Prot, což výrazně zvyšuje počet proteinů, pro které jsou k dispozici vysoce spolehlivé modelovací údaje. Algoritmus AlphaFold také prokázal svou schopnost vypořádat se s víceřetězcovými proteinovými komplexy7.
Paralelně vylepšení kryogenní elektronové mikroskopie (kryo-EM) umožňují výzkumníkům experimentálně řešit i ty nejnáročnější proteiny a komplexy. Cryo-EM skenuje bleskově zmrazené molekuly elektronovým paprskem a generuje obrazy proteinů v různých orientacích, které pak lze výpočtově znovu sestavit do 3D struktury. V roce 2020 umožnila vylepšení hardwaru a softwaru cryo-EM dvěma týmům generovat struktury s rozlišením menším než 1,5 ångströms, zachycující polohu jednotlivých atomů8,9. „Předtím jsme se s výrazem ‚atomové rozlišení‘ pustili s divokým opuštěním, ale bylo to jen téměř atomové,“ říká Bridget Carragher, spoluředitelka Centra pro elektronovou mikroskopii Simonse v New Yorku v New York Structural Biology Center. "Tohle je opravdu atomové." A ačkoli oba týmy použily zvláště dobře prostudovaný modelový protein zvaný apoferritin, říká Carragher, tyto studie naznačují, že blízkoatomové rozlišení je možné i pro jiné, obtížnější cíle.\
Mnoho experimentátorů, kteří byli zpočátku k AlphaFold2 skeptičtí, jej nyní vidí jako jasný doplněk experimentálních metod, jako je cryo-EM, kde jeho výpočetní modely mohou pomoci při analýze a rekonstrukci dat. A cryo-EM může generovat nálezy, které jsou v současné době nedostupné pro výpočetní predikci. Carragherův tým například používá „časově rozlišené“ kryo-EM k zachycení rychlých konformačních změn, ke kterým dochází, když proteiny interagují s jinými molekulami. "Můžeme zachytit věci a vidět, co se děje, v řádu sta milisekund," říká.
Značné vzrušení je také kolem související metody, kryoelektronové tomografie (cryo-ET), která zachycuje naturalistické chování proteinů v tenkých řezech zmrazených buněk. Ale interpretace těchto přeplněných, komplikovaných obrázků je náročná a Carragher si myslí, že výpočetní pokroky ze světa strojového učení budou zásadní. "Jak jinak vyřešíme tyto téměř neřešitelné problémy?" ona se ptá.
Kvantová simulace
Atomy mají atomovou velikost. Ale za správných podmínek je lze převést do vysoce vybuzeného, supervelkého stavu s průměry v řádu jednoho mikrometru nebo více. Provedením této excitace na pečlivě umístěných polích stovek atomů řízeným způsobem fyzici prokázali, že dokážou vyřešit náročné fyzikální problémy, které tlačí konvenční počítače na jejich hranice.
Kvantové počítače spravují data ve formě qubitů. Ve spojení pomocí fenoménu kvantové fyziky zvaného zapletení se qubity mohou navzájem ovlivňovat na dálku. Tyto qubity mohou drasticky zvýšit výpočetní výkon, kterého lze dosáhnout s daným přidělením qubitů vzhledem k ekvivalentnímu počtu bitů v klasickém počítači.
Jak začít s kvantovým počítáním
Několik skupin úspěšně použilo jednotlivé ionty jako qubity, ale kvůli jejich elektrickým nábojům je obtížné je sestavit při vysoké hustotě. Fyzici včetně Antoina Browaeyse z francouzské národní výzkumné agentury CNRS v Paříži a Michaila Lukina z Harvardské univerzity v Cambridge ve státě Massachusetts zkoumají alternativní přístup. Týmy používají optickou pinzetu k přesné poloze nenabitých atomů v těsně zabalených 2D a 3D polích a poté aplikují lasery k excitaci těchto částic do „Rydbergových atomů“ s velkým průměrem, které se zapletou se svými sousedy10 ,11. „Systémy atomů Rydberg jsou individuálně ovladatelné a jejich interakce lze zapínat a vypínat,“ vysvětluje fyzik Jaewook Ahn z Korea Advanced Institute of Science and Technology v Daejeonu v Jižní Koreji. To zase poskytuje programovatelnost.
Tento přístup získal značnou dynamiku v rozmezí pouhých několika let, s technologickým pokrokem, který zlepšil stabilitu a výkon Rydbergových atomových polí, stejně jako rychlým škálováním z několika desítek qubitů na několik stovek. První aplikace se zaměřovaly na definované problémy, jako je předpovídání vlastností materiálů, ale tento přístup je všestranný. "Zatím byl jakýkoli teoretický model, se kterým teoretici přišli, způsob, jak jej implementovat," říká Browaeys.
Průkopníci v oboru založili společnosti, které vyvíjejí systémy založené na atomovém poli Rydberg pro laboratorní použití, a Browaeys odhaduje, že takové kvantové simulátory by mohly být komerčně dostupné za rok nebo dva. Ale tato práce by také mohla připravit cestu ke kvantovým počítačům, které lze použít obecněji, včetně ekonomie, logistiky a šifrování. Výzkumníci se stále snaží definovat místo této stále vznikající technologie ve světě výpočetní techniky, ale Ahn kreslí paralely s raným tlakem bratří Wrightů do letectví. "To první letadlo nemělo žádné dopravní výhody," říká Ahn, "ale nakonec změnilo svět."
Přesná manipulace s genomem
Navzdory všem svým schopnostem upravovat genom je technologie CRISPR–Cas9 vhodnější pro inaktivaci genu než pro opravu. Je to proto, že ačkoli je zacílení enzymu Cas9 na genomovou sekvenci relativně přesné, buněčná oprava výsledného dvouvláknového řezu nikoli. Opravy CRISPR–Cas9, zprostředkované procesem nazývaným nehomologní spojování konců, jsou často zatemněny malými inzercemi nebo delecemi.
Většina genetických onemocnění vyžaduje genovou korekci spíše než narušení, poznamenává David Liu, chemický biolog z Harvardské univerzity v Cambridge. Liu a jeho tým vyvinuli dva slibné přístupy, jak toho dosáhnout. Oba využívají přesné cílení CRISPR a zároveň omezují schopnost Cas9 řezat DNA na tomto místě. První, nazývaný editace báze, spojuje katalyticky narušenou formu Cas9 s enzymem, který napomáhá chemické přeměně jednoho nukleotidu na jiný – například cytosin na thymin nebo adenin na guanin (viz Nature https://doi.org/hc2t; 2016). Pomocí této metody jsou však aktuálně dostupné pouze určité změny mezi základními daty. Primární editace, novější vývoj týmu, spojuje Cas9 s typem enzymu známého jako reverzní transkriptáza a používá vodicí RNA, která je upravena tak, aby zahrnovala požadovanou úpravu genomové sekvence (viz Nature 574, 464– 465; 2019). Prostřednictvím vícestupňového biochemického procesu tyto složky zkopírují vodící RNA do DNA, která nakonec nahradí cílovou sekvenci genomu. Důležité je, že jak základní, tak primární editace přeruší pouze jeden řetězec DNA, což je pro buňky bezpečnější a méně rušivý proces.
Super-přesný nový nástroj CRISPR by si mohl poradit s množstvím genetických chorob
Poprvé popsáno v roce 2016, základní úpravy jsou již na cestě na kliniku: Společnost Beam Therapeutics, založená Liu a sídlící také v Cambridge, dostala v listopadu souhlas od amerického Úřadu pro kontrolu potravin a léčiv, aby tento přístup vyzkoušela na lidech. poprvé s cílem opravit gen, který způsobuje srpkovitou anémii.
Prvotní úpravy nejsou tak daleko, ale stále se objevují vylepšené iterace a příslib této metody je jasný. Hyongbum Henry Kim, specialista na úpravu genomu na Yonsei University College of Medicine v Soulu, a jeho tým prokázali, že mohou dosáhnout až 16% účinnosti pomocí primární úpravy k opravě mutací retinálních genů u myší12 . „Pokud bychom použili nedávno oznámené pokročilejší verze, účinnost by se ještě zlepšila,“ říká. A Liuova skupina zjistila, že primární stroj může pomoci vložení sekvencí DNA o velikosti genu do genomu, což potenciálně nabízí bezpečnější a přísněji kontrolovanou strategii pro genovou terapii13. Tento proces je relativně neefektivní, ale i malá oprava může někdy zabrat dlouhou cestu, poznamenává Liu. „V některých případech je známo, že pokud dokážete nahradit gen na úrovni 10 % nebo dokonce 1 %, můžete nemoc zachránit,“ říká.
Cílené genetické terapie
Léky na bázi nukleových kyselin mohou mít dopad na kliniku, ale stále jsou do značné míry omezené, pokud jde o tkáně, ve kterých mohou být aplikovaný. Většina terapií vyžaduje buď lokální podávání nebo ex vivo manipulaci s buňkami, které jsou sklizeny a poté transplantovány zpět pacientovi. Jednou z výrazných výjimek jsou játra, která filtruje krevní oběh a ukazuje se jako robustní cíl pro selektivní podávání léků. V tomto případě může nitrožilní - nebo dokonce subkutánní - podání provést práci.
„Jen dostat porod do jakékoli tkáně je obtížné, když o tom opravdu přemýšlíte,“ říká Daniel Anderson, chemický inženýr z Massachusetts Institute of Technology (MIT) v Cambridge. "Naše těla jsou navržena tak, aby využívala genetické informace, které máme, a ne k přijímání nově příchozích." Vědci však neustále postupují ve vývoji strategií, které mohou pomoci přenést tyto léky do specifických orgánových systémů a zároveň šetřit jiné, necílové tkáně.
Adeno-asociované viry jsou prostředkem volby pro mnoho snah o genovou terapii a studie na zvířatech ukázaly, že pečlivý výběr správného viru v kombinaci s promotory genů specifických pro tkáň může dosáhnout účinného, orgánově omezeného doručení14 . Viry jsou však někdy náročné na výrobu ve velkém měřítku a mohou vyvolat imunitní reakce, které podkopávají účinnost nebo způsobují nežádoucí účinky.
Lipické nanočástice představují nevirovou alternativu a několik studií publikovaných v posledních několika letech zdůrazňuje potenciál vyladit jejich specificitu. Například přístup selektivního zaměřování orgánů (SORT) vyvinutý biochemikem Danielem Siegwartem a jeho kolegy z University of Texas Southwestern Medical Center v Dallasu umožňuje rychlé generování a screening lipidových nanočástic k identifikaci těch, které mohou účinně cílit na buňky v tkáních, jako je např. jako plíce nebo slezina15. „Byl to jeden z prvních článků, které ukázaly, že pokud provedete systematický screening těchto lipidových nanočástic a začnete měnit jejich složení, můžete zkreslit biodistribuci,“ říká Roy van der Meel, biomedicínský inženýr na Eindhovenské technologické univerzitě. Holandsko. Několik skupin také zkoumá, jak by proteinové složky, jako jsou buněčně specifické protilátky, mohly napomoci procesu cílení, poznamenává Anderson.
Anderson je obzvláště nadšený z preklinického pokroku v zacílení na prekurzory krevních a imunitních buněk v kostní dřeni, který prokázaly společnosti jako Beam Therapeutics a Intellia v Cambridge, které obě používají speciálně navržené formulace lipidových nanočástic. Úspěch v zacílení na tyto tkáně, říká, by mohl ušetřit pacienty od vyčerpávajícího procesu spojeného se současnými ex vivo genovými terapiemi, které zahrnují chemoterapii k usmrcení existující kostní dřeně před transplantací. „Dělat tyto věci in vivo by mohlo skutečně změnit léčbu pacientů,“ říká Anderson.
Prostorová multiomika
Exploze ve vývoji jednobuněčné omiky znamená, že výzkumníci nyní mohou běžně odvozovat genetické, transkriptomické, epigenetické a proteomické poznatky z jednotlivých buněk – někdy současně (viz go.nature.com/3nnhooo). Ale jednobuněčné techniky také obětují zásadní informace tím, že tyto buňky vytrhnou z jejich přirozeného prostředí.
V roce 2016 vědci pod vedením Joakima Lundeberga z KTH Royal Institute of Technology ve Stockholmu vymysleli strategii, jak tento problém překonat. Tým připravil sklíčka s oligonukleotidy s čárovým kódem – krátkými řetězci RNA nebo DNA – které dokážou zachytit messenger RNA z neporušeného tkáňového řezu, takže každý transkript by mohl být přiřazen ke konkrétní pozici ve vzorku podle jeho čárového kódu. "Nikdo opravdu nevěřil, že bychom mohli vytáhnout analýzu celého transkriptomu z tkáňového řezu," říká Lundeberg. "Ale ukázalo se, že je to překvapivě snadné."
Oblast prostorové transkriptomiky od té doby explodovala. Nyní je k dispozici několik komerčních systémů, včetně platformy Visium Spatial Gene Expression od 10x Genomics, která staví na technologii Lundeberg. Akademické skupiny pokračují ve vývoji inovativních metod, které dokážou mapovat genovou expresi se stále větší hloubkou a prostorovým rozlišením.
Nyní výzkumníci vrství na své prostorové mapy další „omické poznatky“. Například biomedicínský inženýr Rong Fan z Yale University v New Haven, Connecticut, vyvinul platformu známou jako DBiT-seq16, která využívá mikrofluidní systém, který dokáže současně generovat čárové kódy pro tisíce transkriptů mRNA a stovky proteinů značených protilátkami značenými oligonukleotidy. To může poskytnout mnohem přesnější posouzení toho, jak buněčná genová exprese ovlivňuje produkci a aktivitu proteinů, než by bylo možné získat ze samotných transkriptomických dat a Fanův tým je používá ke zkoumání procesů, jako je aktivace imunitních buněk. "Vidíme první známky toho, jak imunitní buňky v kůži reagují na vakcínu Moderna COVID-19," říká. Některé komerční systémy mohou také zachytit prostorová data z více proteinů paralelně s transkriptomickými poznatky, včetně platformy Visium a systému GeoMx společnosti Nanostring.
Mezitím Lundebergova skupina vylepšila svou metodu prostorové transkriptomiky, aby současně zachytila data sekvence DNA. To umožnilo jeho týmu začít mapovat časoprostorové události, které jsou základem tumorigeneze. "Mohli bychom sledovat tyto genetické změny ve vesmíru, jak se vyvíjejí do dalších genetických variant, které nakonec vedou k nádoru," říká.
Fanův tým prokázal prostorové mapování modifikací chromatinu ve vzorcích tkání, které může odhalit regulační oblasti buněčných genů, které ovlivňují procesy, jako je vývoj, diferenciace a mezibuněčná komunikace17. Fan je přesvědčen, že metodu lze spárovat s prostorovou analýzou RNA a dokonce i proteinů. "Máme předběžné údaje, které ukazují, že je to zcela proveditelné," říká.
Diagnostika založená na CRISPR
Schopnost systému CRISPR–Cas pro přesné štěpení specifických sekvencí nukleové kyseliny vychází z jeho role jako bakteriálního „imunitního systému“ proti virové infekci. Toto spojení inspirovalo první uživatele této technologie, aby uvažovali o použitelnosti systému pro virovou diagnostiku. „Prostě má smysl používat to, pro co jsou určeny, v přírodě,“ říká Pardis Sabeti, genetik z Broad Institute of MIT a Harvard v Cambridge. "Máte na své straně miliardy let evoluce."
NatureTech centrum
Ale ne všechny enzymy Cas jsou stvořeny stejně. Cas9 je go-to enzym pro manipulaci s genomem na bázi CRISPR, ale velká část práce v diagnostice založené na CRISPR využívá rodinu molekul cílených na RNA známou jako Cas13, poprvé identifikované v roce 2016 molekulárním biologem Feng Zhangem a jeho týmem Široký. „Cas13 používá svého průvodce RNA k rozpoznání cíle RNA párováním bází a aktivuje ribonukleázovou aktivitu, kterou lze využít jako diagnostický nástroj pomocí reportérské RNA,“ vysvětluje Jennifer Doudna z University of California v Berkeley, která sdílela Nobelova cena za chemii 2020 s Emmanuelle Charpentier, nyní na oddělení Maxe Plancka pro vědu o patogenech v Berlíně, za rozvoj schopností CRISPR-Cas9 pro úpravy genomu. Je to proto, že Cas13 nejen řeže RNA cílenou vodicí RNA, ale také provádí „kolaterální štěpení“ na jakýchkoli jiných blízkých molekulách RNA. Mnoho diagnostik založených na Cas13 používá reportérovou RNA, která naváže fluorescenční značku na zhášecí molekulu, která tuto fluorescenci inhibuje. Když je Cas13 aktivován po rozpoznání virové RNA, přeruší reportér a uvolní fluorescenční značku ze zhášeče, čímž se vytvoří detekovatelný signál. Některé viry zanechávají dostatečně silný podpis, že detekce lze dosáhnout bez zesílení, což zjednodušuje diagnostiku v místě péče. Například loni v lednu Doudna a Melanie Ott z Gladstone Institute of Virology v San Franciscu v Kalifornii předvedli rychlý test CRISPR-Cas13 založený na nosním výtěru pro bezamplifikační detekci SARS-CoV-2 pomocí mobilního telefonu. fotoaparát18.
Postupy amplifikace RNA mohou zvýšit citlivost na stopové virové sekvence a Sabeti a její kolegové vyvinuli mikrofluidní systém, který paralelně skrínuje více patogenů pomocí amplifikovaného genetického materiálu z pouhých několika mikrolitrů vzorku19. "Právě teď máme test na 21 virů současně za méně než 10 USD za vzorek," říká. Sabeti a její kolegové vyvinuli nástroje pro detekci více než 169 lidských virů na základě CRISPR najednou, dodává.
Další enzymy Cas by mohly doplnit sadu diagnostických nástrojů, poznamenává Doudna, včetně proteinů Cas12, které vykazují podobné vlastnosti jako Cas13, ale zaměřují se spíše na DNA než na RNA. Společně by mohly detekovat širší spektrum patogenů nebo dokonce umožnit účinnou diagnostiku jiných neinfekčních onemocnění. "To by mohlo být velmi užitečné, pokud byste to dokázali relativně rychle, zvláště když se různé podtypy rakoviny definují konkrétními typy mutací," říká Doudna.