Bioinf3.doc

(35 KB) Pobierz
SRS 2

Bioinformatyka 2006/07 2.2007

SRS 2

 

1.      Znajdź w bazie danych UNIPROT białka histonowe roślin (rosliny po łacinie : viridiplantae). Ile jest sekwencji białek histonów roślin w bazie UNIPROT?

Srs.ebi.ac.uk (najłatwie poszukaćj „srs” w google)

Description : histone protein

Organism name : viridiplantae

 

2.      Znajdź w bazie danych UNIPROT sekwencje nieroślinnych białek histonowych. Ile jest takich białek?

Description : histone protein

Organism name : viridiplantae , wybrać z lewej strony „BUT NOT”

 

3.      Znajdź w bazie danych EMBL sekwencje DNA, do których istnieją odnośniki w wejściach do bazy danych UNIPROT białek histonowych nieroślinnych.

Wynik z poprzedniego, zakładka result – ostatnie zapytanie – link – embl - search

 

4.      Zaprojektuj własny view (sposób przedstawienia wyników) UNIPROTa, zawierające dane z pola opis wejść EMBL „połączonych” z oglądanymi wejściami UNIPROTa. Za pomocą swojego view obejrzyj wyniki z ćwiczenia pierwszego.

Zakładka views , w jednym oknie EMBL, w drugim UNIPROT, - nazwać profil – create new view – wybieramy co chcemy z danej bazy – wybrac pytanie – na dole „view”

 

5.      Znajdź enzymy z bazy danych ENZYME obrabiające GTP. Ile jest takich enzymów? Ile jest w bazie danych UNIPROT białek kodujących te enzymy?

Library page: expand all – baza ENZYME

-query : reaction : GTP

Do UNIPROT przez linki

 

6.      Ile enzymów używających GTP wykorzystują wspólnie eukaryota, bacteria i archebacteria? Wykorzystaj fakt, że baza danych ENZYME jest połączona z bazą danych UNIPROT, a sekwencje UNIPROTa można przeszukiwać taksonami. (nazwy stosowane przez srs : bacteria , archaea, eukaryota)

    1. Podziel bazę UNIPROT na 3 części : podbazę białek archeonowych, prokariotycznych i eukariotycznych
    2. Stwórz podzbiór bazy ENZYME enzymów wykorzystujących GTP jak w p.5
    3. Utwórz trzy podzbiory bazy ENZYME zawierające połączenia do odpowiednich podzbiorów UNIPROTa z p.a
    4. Znajdź część wspólną tych podzbiorów

3x query form – taxonomy : kolejno – Archaea , bacteria, eukaryota.

Otrzymujemy trzy niezależne.

Result – wybieramy zapytania (query numner) : GTP > Uniprot i Uni:Euk -> combine (po lewej)

 

7.      zrób mapę restrykcyjną sekwencji j01749

Srs – j01749.

Tools – nucleic – Remap – lunch

Wyniki w results

8.      Na jakie fragmenty sekwencja j01749 zostanie pocięta przez enzym AfaI?

Tools – nucleic (restriction) – remap (wklejamy sekwencję) – AfaI (izoschizomer RsaI)

9.      Czy białko o identyfikatorze p17547 posiada motywy sekwencji związane  funkcją?

Srs – baza UNIPROT – p17547 (id)

Tools – protein motifs – patmatmotifs – wklejamy sekwencję aa

 

10.  Znajdź najlepszy lokalny alignment histonów H1.0 człowieka i H1.1 Arabidopsis  thaliana

Org. name : homo sapiens sapiens v arabidopsis thaliana

Swprotname : histone H1

Odnalezienie obu sekwencji, wrzucenie formatu fasta do machern/macherp

 

11.  Powtórz powyższe ćwiczenie używając. Policz Z-score dla uzyskanego alignmentu.

.http://www.ch.embnet.org/software/PRSS_form.html

wynik : wartość E

 

12.  Poszukaj PSI-blastem homologów ludzkiego histonu H1.0. Znajdź najlepszy lokalny alignment tego białka i ostatniego homologa z PSI-Blasta. Policz Z-score (za pomocą PRSS) dla 200 i 1000 randominizacji drugiej sekwencji.

NCBI – psi-blast (na sekwencji z pkt.10)

 

13.  Znajdź najlepszy globalny alignment histonów H1 człowieka i H1.1 Arabidopsis thaliana

Tools – strecherp

 

14.  Znajdź paralogi białka ypt7_yeast w genomie drożdżowym

Sekwencja białkowa – blast (NCBI) – sacca (baza yeast)) – blast!

 

15.  Znajdź potencjalne miejsca modyfikacji potranslacyjnych w ludzkiej dehydrogenazie alkoholowej.

Alkohol dehydrogenase – przejście do EXPASY (google) – program Prosite scan(umieszczamy czystą sekwencję, nie w formacie Fasta)

 

Expasy home – (po prawej) post-tran – pattern & profiles – Prosite scan

 

16.  Znajdź 10 sekwencji homologicznych do rybonukleazy A z Cavia porcellus. Zrób multiple alignment tych sekwencji.

Srs – Uniprot base – protein blast – get a selected sequences – display: Fasta – sent to:text – alignment

 

17.  Znajdź domeny w białku p43610 przez porównanie sekwencji do ukrytych modeli Markowa znanych domen białek.

Tools – expand all – Hmmpfam

 

18.  Czy drożdżowy H1 zawiera zduplikowane domeny?

...
Zgłoś jeśli naruszono regulamin