Projekt k druhé půli přednášky PB051 -- analýza biologických sítí

Část I (statická analýza, intergace dat)

Stáhněte si soubor obsahující data genové interakční sítě E. Coli. Uzly odpovídají jednotlivým genům a orientované hrany signalizují vazbu proteinu zdrojového genu na cílový gen. (Zdrojem je regulondb, soubor byl využíván na přednáškách v 7.týdnu.) Ze sítě vyberte gen flhCflhD a vytvořte podsíť zahrnující tento uzel, jeho sousední uzly a všechny jejich sousedy. S touto podsítí budete dále pracovat.

Z Gene Ontology (GO) stáhněte aktuální soubor anotačních dat specifických pro E. coli. Tyto soubory jsou k disposici zde. Jedná se o anotační mapu prověřenou v relevanci k příslušnému živočišnému druhu. Soubor použijte jako interface k importu GO anotačních atributů k uzlům sítě E. Coli.

Pomocí pluginu BINGO (kategorie Functional enrichment) zjistěte statistickou míru nadreprezentace jednotlivých anotačních GO termů typu "GO_Biological_Process" v analyzované síti. Nejprve jako referenční množinu statistického testu zvolte kompletní anotační strom. Test opakujte s omezením na relevantní anotační podstrom jako referenční množinu, výsledky porovnejte. Vytvořte tabulku shrnující výsledky obou testů pro každý zahrnutý GO proces (výsledky lze vhodně vizualizovat koláčovým grafem).

Hint: Tutoriál Cytoscape.

Analýzu opakujte pro síť vytvořenou z genu crp a všech jím bezprostředně regulovaných genů.

Část II (dynamická analýza)

Uvažujte následující regulační síť (použito notace SBGN dle nástroje CellDesigner).

Dynamiku této sítě lze zjednodušeně modelovat při zanedbání vazby RNAP a reakcí doprovázejících transkripci a translaci následujícím systémem chemických rovnic:

Vytvořte stochastický model této reakční sítě a zvolte vhodně několik sad relevantních kinetických konstant (na úrovni řádů) dle následující literatury (volně dostupno z domény FI):

Frekvenci dimerizace/dedimerizace proteinu a vazby proteinu na promotor uvažujte řádově v jednotkách, rozpad této vazby v desítkách s-1.

Iniciální podmínky lze volit dle následujícího schematu:

Použijte nástroj Dizzy a pro vybranou sadu kinetických parametrů proveďte několik exaktních simulací (pro různá nastavení počtu experimentů) metodou Gibson-Bruck a aproximativní metodou tau-leaping. Výsledky porovnejte. Zaznamenejte grafy simulací a diskutujte, zda aproximativní metoda je pro tento model prakticky použitelná.

Použijte nástroj COPASI pro deterministickou simulaci modelu. Porovnejte výsledky se stochastickou simulací, uvažujte časové okno 0-5000 s a 0-10 s. Diskutujte případnou opodstatněnost stochastického přístupu pro tento model. Zjistěte citlivost modelu na změnu jednotlivých kinetických parametrů (sensitivity analysis). Rozhodněte, zda lze pro tento model prakticky uplatnit metodu numerické simulace s pevným časovým krokem (možno použít nástroj Dizzy).

Proveďte statistickou analýzu výsledků stochastické simulace v bodě 10 s (uvažujte vzorek 10000 simulací). Lze použít Dizzy v command-line režimu. Vytvořte histogram zachycující rozložení počtů molekul proteinu P v bodě 10 s. Diskutujte získané rozložení a opakujte postup pro ostatní sady nastavení kinetických parametrů.

Pro nejcitlivější a nejméně citlivý parametr vygenerujte sady parametrů, v nichž je daný parametr generován z uniformního rozložení (ve vhodném intervalu) a ostatní parametry jsou fixovány. Proveďte statistickou analýzu výsledků stochastické simulace v bodě 10 s (uvažujte vzorek 1000 simulací pro každou vygenerovanou sadu parametrů, uvažujte 50 sad). Vytvořte histogram zachycující rozložení počtů molekul proteinu P v bodě 10 s. Porovnejte získaný histogram s histogramy z předchozího příkladu.