Stáhněte si soubor obsahující data genové interakční sítě Z Gene Ontology (GO) stáhněte aktuální soubor anotačních dat specifických pro E. coli. Tyto soubory jsou k disposici zde. Jedná se o anotační mapu prověřenou v relevanci k příslušnému živočišnému druhu. Soubor použijte jako interface k importu GO anotačních atributů k uzlům sítě E. Coli.
Pomocí pluginu BINGO (kategorie Functional enrichment) zjistěte statistickou míru nadreprezentace jednotlivých anotačních GO termů typu "GO_Biological_Process" v analyzované síti. Nejprve jako referenční množinu statistického testu zvolte kompletní anotační strom. Test opakujte s omezením na relevantní anotační podstrom jako referenční množinu, výsledky porovnejte. Vytvořte tabulku shrnující výsledky obou testů pro každý zahrnutý GO proces (výsledky lze vhodně vizualizovat koláčovým grafem).
Hint: Tutoriál Cytoscape.
Analýzu opakujte pro síť vytvořenou z genu crp a všech jím bezprostředně regulovaných genů. Uvažujte následující regulační síť (použito notace SBGN dle nástroje CellDesigner).
Dynamiku této sítě lze zjednodušeně modelovat při zanedbání vazby RNAP a reakcí doprovázejících transkripci a translaci následujícím systémem chemických rovnic:
Vytvořte stochastický model této reakční sítě a zvolte vhodně několik sad relevantních kinetických konstant (na úrovni řádů) dle následující literatury (volně dostupno z domény FI):
Frekvenci dimerizace/dedimerizace proteinu a vazby proteinu na promotor uvažujte řádově v jednotkách, rozpad této vazby v desítkách s-1.
Iniciální podmínky lze volit dle následujícího schematu:
Použijte nástroj Dizzy a pro vybranou sadu kinetických parametrů proveďte několik exaktních simulací (pro různá nastavení počtu experimentů) metodou Gibson-Bruck a aproximativní metodou tau-leaping. Výsledky porovnejte. Zaznamenejte grafy simulací a diskutujte, zda aproximativní metoda je pro tento model prakticky použitelná.
Použijte nástroj COPASI pro deterministickou simulaci modelu. Porovnejte výsledky se stochastickou simulací, uvažujte časové okno 0-5000 s a 0-10 s. Diskutujte případnou opodstatněnost stochastického přístupu pro tento model. Zjistěte citlivost modelu na změnu jednotlivých kinetických parametrů (sensitivity analysis). Rozhodněte, zda lze pro tento model prakticky uplatnit metodu numerické simulace s pevným časovým krokem (možno použít nástroj Dizzy).
Proveďte statistickou analýzu výsledků stochastické simulace v bodě 10 s (uvažujte vzorek 10000 simulací). Lze použít Dizzy v command-line režimu. Vytvořte histogram zachycující rozložení počtů molekul proteinu P v bodě 10 s. Diskutujte získané rozložení a opakujte postup pro ostatní sady nastavení kinetických parametrů.
Pro nejcitlivější a nejméně citlivý parametr vygenerujte sady parametrů, v nichž je daný parametr generován z uniformního rozložení (ve vhodném intervalu) a ostatní parametry jsou fixovány. Proveďte statistickou analýzu výsledků stochastické simulace v bodě 10 s (uvažujte vzorek 1000 simulací pro každou vygenerovanou sadu parametrů, uvažujte 50 sad). Vytvořte histogram zachycující rozložení počtů molekul proteinu P v bodě 10 s. Porovnejte získaný histogram s histogramy z předchozího příkladu.
Část II (dynamická analýza)