bioinformatyka ćwiczenia zdalne.rtf

(60 KB) Pobierz

Ćwiczenie 1

wstęp do bioinformatyki

 

METODY, APLIKACJE, BAZY DANYCH

 

Oprogramowanie bioinformatyczne:

 

1.Programy do pobrania na dysk lokalny

Darmowe

 

Płatne (shareware)

 

 

 

2.Aplikacje on-line:

Darmowy dostęp

 

Płatna rejestracja

 

 

 

OPROGRAMOWANIE BIOINFORMATYCZNE

 

-przyjazne,

-efektowne

-wysokiej jakości

 

 

Od czego najlepiej zacząć?

ExPASy

http://www.expasy.org/

 

Swiss-Prot

baza sekwencji białkowych 

http://www.expasy.org/sprot/

 

NCBI

Centrum serwisowe bioinformatyki.

http://www.ncbi.nlm.nih.gov/

 

EBI

Europejskie centrum bioinformatyczne.

http://www.ebi.ac.uk/

 

GenomeNet

Japoński serwis bioinformatyczny i genomowy.

http://www.genome.ad.jp/

 

EMBNet

Serwis szwajcarski.

http://www.ch.embnet.org/

 

Protein Data Bank (PDB)

Główna baza struktur białkowych.

http://www.rcsb.org/pdb/index.html

 

DBTSS: Genomowa baza miejsc startowych transkrypcji.

http://dbtss.hgc.jp/index.html

 

CENTRA BADAŃ GENOMU CZŁOWIEKA

 

 

Fizames

 

Lawrence Berkeley Laboratory Human Genome Center (LBL)

 

http://www.hgc.lbl.gov/GenomeHome.html

Michael

 

Palazzolo

Nomi

 

Harris

 

Lawrence Livermore National Laboratory Biology and Biotechnology Research Program (LLNL)

 

http://www.bio.llnl.gov/bbrp/genome/genome.html

Tony

 

Carrano

Tom

 

Slezak

 

Los Alamos National Laboratory Center for Human Genome Studies (LANL)

 

http://www.ls.lanl.gov/index.html

Larry L.

 

Deaven

Robert

Sutherland

 

BIOINFORMATYCZNE SERWISY/BAZY DANYCH

 

BLAST - pakiet programów do wyszukiwania i analizy porównawczej sekwencji.

http://www.ncbi.nlm.nih.gov/BLAST/

 

SWISS-MODEL

Narzędzie teoretycznego modelowania struktur białkowych.

http://www.expasy.org/swissmod/SWISS-MODEL.html

 

PŁATNE OPROGRAMOWANIE BIOINFORMATYCZNE

 

ęłęóhttp://www.accelrys.com/

 

http://www.tripos.com

 

PEDRO'S BIOMOLECULAR RESEARCH TOOLS

 

Pedro's BioMolecular Research Tools.

Zbiór narzędzi z zakresu bioinformatyki, genomiki i proteomiki.

http://www.biophys.uni-duesseldorf.de/BioNet/Pedro/research_tools.html

 

 

ęłęóDopasowywanie homologicznych sekwencji - ClustalX

 

 

ęłęóKonstrukcja molekularnych drzew filogenetycznych

ęłęóProgram TreeView

 

ANALIZA ZMIENNOŚCI I RÓŻNICOWANIA

 

Zdecydowana większość dostępnych narzędzi służących do teoretycznej analizy porównawczej sekwencji białkowych wykorzystuje stochastyczne macierze substytucji aminokwasowych w odpowiadających sobie pozycji w homologicznych białkach.

Macierze opisują obserwowane częstości wzajemnej substytucji aminokwasów, co prezentowane jest przez wartości liczbowe zawarte w macierzach.

 

Wartości te odpowiadają współczynnikom prawdopodobieństwa wzajemnej wymiany aminokwasów i podane są w taki sposób, by umożliwić łatwą identyfikację przemian zachodzących częściej lub rzadziej niż wynikałoby to z losowego prawdopodobieństwa ich zajścia.

Wyróżnia się dwie zasadnicze grupy macierzy substytucji aminokwasów: PAM i BLOSUM. Różnią się one metodą obliczeniową użytą do ich skonstruowania.

 

Macierze PAM wyliczone są dla obserwowanych przemian mutacyjnych w ujęciu globalnym, tzn. dotyczą wszystkich przemian dla porównywanych sekwencji w całości.

Macierze BLOSUM konstruowane są na podstawie analizy przemian pewnych tylko fragmentów porównywanych sekwencji. Wybierane są fragmenty, dla których wzajemny stopień zróżnicowania przekracza zadeklarowaną wartość progową.

Np. do konstrukcji macierzy BLOSUM62 brane pod uwagę są tylko te fragmenty, które wykazują wzajemny stopień identyczności nie większy niż 62%.

 

ęłęóMacierz mutacyjnych substytucji aminokwasów 1/2

PAM250

BLOSUM62

 

 

ALGORYTM SEMIHOMOLOGII GENETYCZNEJ

 

Algorytm semihomologii genetycznej w swej konstrukcji wyraźnie odbiega od większości metod porównywania sekwencji białkowych i analizy ich zmienności. 

Przede wszystkim nie opiera się na stochastycznych macierzach substytucji aminokwasowych.

Zamiast nich, fundamentalnym elementem metody jest trójwymiarowy diagram relacji genetycznych między aminokwasami.

 

Algorytm semihomologii genetycznej uwzględnia zarówno czynnik zmienności mutacyjnej na poziomie genetycznym, jak i presji selekcyjnej na poziomie białkowym.

Dzięki temu bierze pod uwagę wszystkie mechanizmy składające się na proces ewolucji molekularnej.

Umożliwia prześledzenie oraz wyjaśnienie mechanizmów i szlaków ewolucyjnych różnicowania się w obrębie danej grupy spokrewnionych ze sobą białek.

 

DIAGRAM RELACJI GENETYCZNYCH

 

-między kodonami

-między aminokwasami

 

ANALIZA  PORÓWNAWCZA SEKWENCJI

 

http://bioinfo.icm.edu.pl/geisha/

analiza podobieństwa i homologii sekwencji białkowych,

dopasowywanie sekwencji aminokwasowych w oparciu o relacje genetyczne,

analiza zmienności mutacyjnej w obrębie homologicznych rodzin białkowych,

badania wspomagające przy konstruowaniu molekularnych drzew filogenetycznych.

 

PROGRAM GEISHA

 

Porównywanie dwóch sekwencji białkowych

http://bioinfo.icm.edu.pl/geisha/

 

Porównywanie wielu sekwencji białkowych i konstrukcja drzewa filogenetycznego.

http://bioinfo.icm.edu.pl/geisha/

 

PROGRAM SSSS

 

ęłęóOszacowanie istotności podobieństwa sekwencji.

 

ęłęóWeryfikacja istotności podobieństwa wynikającego z najlepszego dopasowania sekwencji.

 

PROGRAM CONSENSUS CONSTRUCTOR

 

Wizualizacja optymalnego dopasowania wielu sekwencji i konstrukcja sekwencji konsensusowych.

Konstrukcja szeregu sekwencji konsensusowych dla jednego zestawu dopasowanych sekwencji, przy zmiennych parametrach progowych.

Eksportowanie wyników w formacie rtf (MS Word).

 

MUTACJE SPRZĘŻONE

 

Zjawisko występowania mutacji wzajemnie zależnych. Jest to pozytywna selekcja jednej mutacji uwarunkowana pojawieniem się innej mutacji w innym miejscu.

Zgodnie z aktualną hipotezą pozytywnej selekcji darwinowskiej na poziomie molekularnym, mutacje sprzężone odnoszą się do obszarów będących w bezpośrednim kontakcie, związane są z interakcją białko-białko oraz mają na celu zachowanie ogólnych własności strukturalnych i funkcjonalnych cząsteczki (dotyczą elementów biologicznie aktywnego centrum w białku).

 

Przykład wzajemnego rozmieszczenia pozycji wykazujących sprzężenie mutacyjne (rodzina inhibitorów proteinaz typu Bowmana-Birk). Wąski klaster pozycji sprzężonych ( efekt domina ).

 

PROGRAM CORM

 

Program Corm

Lokalizacja i charakterystyka mutacji sprzężonych występujących w obrębie homologicznej rodziny białek.

http://tarawa.icm.edu.pl/agorecki/corm

 

PROGRAM HCA Plot

 

ęłęóAnaliza i przewidywanie struktury drugorzędowej białek.

 

PROGRAM PREDICT7

 

ęłęóKompleksowa analiza i przewidywanie teoretyczne właściwości białek na podstawie ich sekwencji aminokwasowej.

 

PROGRAM PROTEIN SEQUENCE ANALYSIS

 

ęłęóKompleksowa analiza i przewidywanie teoretyczne właściwości białek na podstawie ich sekwencji aminokwasowej.

 

PROGRAM ANTHEPROT (ANTHEWIN)

 

Przewidywanie struktury drugorzędowej.

Kompleksowa analiza i przewidywanie teoretyczne właściwości białek na podstawie ich sekwencji aminokwasowej.

 

ęłęóKompleksowa analiza i przewidywanie teoretyczne właściwości białek na podstawie ich sekwencji aminokwasowej. Koło helikalne.

 

PROGRAM RASMOL

 

ęłęóBiałkowe przeglądarki 3D.

 

PROGRAM SWISS PDB VIEWER

 

ęłęóBiałkowe przeglądarki 3D.

 

PROGRAM WEBLAB VIEWER ( ACCELRYS )

 

ęłęóBiałkowe przeglądarki 3D.

 

ANIMACJA W PRZEGLĄDARKACH MOLEKULARNYCH

 

USŁUGI ZDALNEGO NAUCZANIA I ZDALNYCH KURSÓW

 

ęłęóhttp://tarawa.icm.edu.pl/lulu/Bioserver.htm

 

 

 

ĆWICZENIE

 

w celu wykonania ćwiczenia, wykonaj następujące polecenia:

Wyszukaj i pobierz sekwencje aminokwasowe dla ludzkich glukokinaz z bazy sekwencji białkowych Swiss-Prot.

Jeśli znane są ich struktury przestrzenne, to pobierz je z bazy PDB.

 

Wykonanie ćwiczenia:

Otwórz stronę serwisu bioinformatycznego ExPASy,

Kliknij na łącze do sekwencyjnej bazy danych Swiss-Prot i otwórz stronę tej bazy,

W okno tekstowe wyszukiwarki wpisz słowa kluczowe "human glucokinase" i kliknij na przycisk "Go".

 

ęłęóStrona główna bazy sekwencji białkowych Swiss-Prot (i TrEMBL) z oknem tekstowym wyszukiwarki w górnej części ekranu.

 

W bazie Swiss-Prot znalezione zostaną trzy rekordy, z których dwa dotyczą ludzkich glukokinaz, a jeden jest rekordem białka regulatorowego ludzkiej glukokinazy. Oprócz nich znalezione zostaną dodatkowe dwa rekordy z bazy TrEMBL.

Warunki zadania spełniają dwa rekordy o kodach: ADPGK_HUMAN (Q9BRR6) oraz HXK4_HUMAN (P35557). Oba posiadają przekierowanie do danych na temat struktury trzeciorzędowej, przy czym rekord ADPGK_HUMAN (Q9BRR6) zawiera link jedynie do bazy ModBase (a nie do bazy PDB).

 

ęłęóWynik wyszukiwania ludzkiej glukokinazy w bazie sekwencji białkowych Swiss-Prot.

 

ęłęóFragment rekordu ADPGK_HUMAN (Q9BRR6) zawierający łącznik do strukturalnej bazy ModBase.

 

ęłęóWygląd rekordu struktury ludzkiej glukokinazy o kodzie Swiss-Prot Q9BRR6, pobrany z bazy strukturalnej ModBase.

 

Dopiero w strukturalnym rekordzie ModBase znajduje się informacja (i łącznik) o rekordzie pdb z danymi strukturalnymi dla tego białka. Podany jest także kod pdb tego białka (1ua4A).

Rekord bazy Swiss-Prot glukokinazy P35557 zawiera bogatszą informację strukturalną o tym białku. Znajdują się w nim łączniki zarówno do bazy ModBase, jak i bazy PDB.

 

ęęłęóWygląd rekordu (fragment) struktury ludzkiej glukokinazy o kodzie Swiss-Prot Q9BRR6 i kodzie PDB 1UA4, pobrany z bazy

struktur białkowych PDB.

 

ęęłęóFragment rekordu HXK4_HUMAN (P35557) zawierający łączniki do strukturalnej bazy ModBase oraz PDB.

 

Sekwencje pobrać można z rekordów bazy Swiss-Prot. Dla wygody użytkownika można od razu pobrać sekwencję zapisaną w formacie FASTA. Łącznik do tych danych znajduje się w końcowej części rekordu po prawej stronie.

Plik pdb ze strukturą przestrzenną białka pobrać można z rekordu bazy PDB, korzystając z łącznika "Download Files". Z tego samego miejsca można także pobrać sekwencję aminokwasową białka.

 

ęęłęóWygląd rekordu (fragment) struktury ludzkiej glukokinazy o kodzie Swiss-Prot P35557 i kodzie PDB 1GLK, pobrany z bazy

struktur białkowych PDB.

 

ęęłęóDolna część rekordu bazy danych Swiss-Prot z łącznikiem do sekwencji białka zapisanej w formacie FASTA.

 

 

ĆWICZENIE 1.2

 

ęęłęóW celu wykonania ćwiczenia, wyszukaj i pobierz graficzną reprezentację struktury przestrzennej dla białka o kodzie Swiss-Prot P02144.

 

 

 

 

 

ĆWICZENIE 2

ANALIZA TEORETYCZNA BIAŁEK W OPARCIU O ICH STRUKTURĘ PIERWSZORZĘDOWĄ

ANALIZA BIAŁEK NA POZIOMIE STRUKTURY PIERWSZORZĘDOWEJ

PODOBIEŃSTWO FUNKCJONALNE I SEMIGOMOLOGIA GENETYCZNA

 

 

ANALIZA SEKWENCJI BIAŁEK

 

Poznanie struktury pierwszorzędowej białka umożliwia jego głębszą analizę w aspekcie konformacyjnym i funkcjonalnym poprzez porównanie z bardziej poznanymi białkami wykazującymi homologię w sekwencji aminokwasowej.

Informacje uzyskiwane dzięki takiej analizie są znacznie bogatsze niż proste wykazanie stopnia identyczności.

W ciągu minionych dwudziestu lat opracowano znaczną ilość algorytmów do analizy sekwencji białek (jak również kwasów nukleinowych) i skonstruowano setki programów opartych na nich.

 

INTERPRETACJA GRAFICZNA

 

Uzyskiwane z porównania wyniki przedstawia się powszechnie za pomocą interpretacji graficznej, która jednoznacznie wykrywa i lokalizuje fragmenty homologiczne, miejsca insercji i delecji, oraz wielodomenową budowę białka (homologia wewnętrzna wynikająca z duplikacji, bądź multiplikacji genu kodującego dane białko). Przykłady takich wyników przedstawione są na następujących rysunkach.

 

Interpretację graficzną stanowi dwuwymiarowy diagram, w którym oś odciętych reprezentuje sekwencję jednego, a oś rzędnych drugiego z porównywanych białek. Na diagramie zaznaczane są punkty, których współrzędne odpowiadają numerom pozycji okupowanych przez identyczne reszty aminokwasowe w porówn...

Zgłoś jeśli naruszono regulamin