Ćwiczenie 1
wstęp do bioinformatyki
METODY, APLIKACJE, BAZY DANYCH
Oprogramowanie bioinformatyczne:
1.Programy do pobrania na dysk lokalny
Darmowe
Płatne (shareware)
2.Aplikacje on-line:
Darmowy dostęp
Płatna rejestracja
OPROGRAMOWANIE BIOINFORMATYCZNE
-przyjazne,
-efektowne
-wysokiej jakości
Od czego najlepiej zacząć?
ExPASy
http://www.expasy.org/
Swiss-Prot
baza sekwencji białkowych
http://www.expasy.org/sprot/
NCBI
Centrum serwisowe bioinformatyki.
http://www.ncbi.nlm.nih.gov/
EBI
Europejskie centrum bioinformatyczne.
http://www.ebi.ac.uk/
GenomeNet
Japoński serwis bioinformatyczny i genomowy.
http://www.genome.ad.jp/
EMBNet
Serwis szwajcarski.
http://www.ch.embnet.org/
Protein Data Bank (PDB)
Główna baza struktur białkowych.
http://www.rcsb.org/pdb/index.html
DBTSS: Genomowa baza miejsc startowych transkrypcji.
http://dbtss.hgc.jp/index.html
CENTRA BADAŃ GENOMU CZŁOWIEKA
Fizames
Lawrence Berkeley Laboratory Human Genome Center (LBL)
http://www.hgc.lbl.gov/GenomeHome.html
Michael
Palazzolo
Nomi
Harris
Lawrence Livermore National Laboratory Biology and Biotechnology Research Program (LLNL)
http://www.bio.llnl.gov/bbrp/genome/genome.html
Tony
Carrano
Tom
Slezak
Los Alamos National Laboratory Center for Human Genome Studies (LANL)
http://www.ls.lanl.gov/index.html
Larry L.
Deaven
Robert
Sutherland
BIOINFORMATYCZNE SERWISY/BAZY DANYCH
BLAST - pakiet programów do wyszukiwania i analizy porównawczej sekwencji.
http://www.ncbi.nlm.nih.gov/BLAST/
SWISS-MODEL
Narzędzie teoretycznego modelowania struktur białkowych.
http://www.expasy.org/swissmod/SWISS-MODEL.html
PŁATNE OPROGRAMOWANIE BIOINFORMATYCZNE
ęłęóhttp://www.accelrys.com/
http://www.tripos.com
PEDRO'S BIOMOLECULAR RESEARCH TOOLS
Pedro's BioMolecular Research Tools.
Zbiór narzędzi z zakresu bioinformatyki, genomiki i proteomiki.
http://www.biophys.uni-duesseldorf.de/BioNet/Pedro/research_tools.html
ęłęóDopasowywanie homologicznych sekwencji - ClustalX
ęłęóKonstrukcja molekularnych drzew filogenetycznych
ęłęóProgram TreeView
ANALIZA ZMIENNOŚCI I RÓŻNICOWANIA
Zdecydowana większość dostępnych narzędzi służących do teoretycznej analizy porównawczej sekwencji białkowych wykorzystuje stochastyczne macierze substytucji aminokwasowych w odpowiadających sobie pozycji w homologicznych białkach.
Macierze opisują obserwowane częstości wzajemnej substytucji aminokwasów, co prezentowane jest przez wartości liczbowe zawarte w macierzach.
Wartości te odpowiadają współczynnikom prawdopodobieństwa wzajemnej wymiany aminokwasów i podane są w taki sposób, by umożliwić łatwą identyfikację przemian zachodzących częściej lub rzadziej niż wynikałoby to z losowego prawdopodobieństwa ich zajścia.
Wyróżnia się dwie zasadnicze grupy macierzy substytucji aminokwasów: PAM i BLOSUM. Różnią się one metodą obliczeniową użytą do ich skonstruowania.
Macierze PAM wyliczone są dla obserwowanych przemian mutacyjnych w ujęciu globalnym, tzn. dotyczą wszystkich przemian dla porównywanych sekwencji w całości.
Macierze BLOSUM konstruowane są na podstawie analizy przemian pewnych tylko fragmentów porównywanych sekwencji. Wybierane są fragmenty, dla których wzajemny stopień zróżnicowania przekracza zadeklarowaną wartość progową.
Np. do konstrukcji macierzy BLOSUM62 brane pod uwagę są tylko te fragmenty, które wykazują wzajemny stopień identyczności nie większy niż 62%.
ęłęóMacierz mutacyjnych substytucji aminokwasów 1/2
PAM250
BLOSUM62
ALGORYTM SEMIHOMOLOGII GENETYCZNEJ
Algorytm semihomologii genetycznej w swej konstrukcji wyraźnie odbiega od większości metod porównywania sekwencji białkowych i analizy ich zmienności.
Przede wszystkim nie opiera się na stochastycznych macierzach substytucji aminokwasowych.
Zamiast nich, fundamentalnym elementem metody jest trójwymiarowy diagram relacji genetycznych między aminokwasami.
Algorytm semihomologii genetycznej uwzględnia zarówno czynnik zmienności mutacyjnej na poziomie genetycznym, jak i presji selekcyjnej na poziomie białkowym.
Dzięki temu bierze pod uwagę wszystkie mechanizmy składające się na proces ewolucji molekularnej.
Umożliwia prześledzenie oraz wyjaśnienie mechanizmów i szlaków ewolucyjnych różnicowania się w obrębie danej grupy spokrewnionych ze sobą białek.
DIAGRAM RELACJI GENETYCZNYCH
-między kodonami
-między aminokwasami
ANALIZA PORÓWNAWCZA SEKWENCJI
http://bioinfo.icm.edu.pl/geisha/
analiza podobieństwa i homologii sekwencji białkowych,
dopasowywanie sekwencji aminokwasowych w oparciu o relacje genetyczne,
analiza zmienności mutacyjnej w obrębie homologicznych rodzin białkowych,
badania wspomagające przy konstruowaniu molekularnych drzew filogenetycznych.
PROGRAM GEISHA
Porównywanie dwóch sekwencji białkowych
Porównywanie wielu sekwencji białkowych i konstrukcja drzewa filogenetycznego.
PROGRAM SSSS
ęłęóOszacowanie istotności podobieństwa sekwencji.
ęłęóWeryfikacja istotności podobieństwa wynikającego z najlepszego dopasowania sekwencji.
PROGRAM CONSENSUS CONSTRUCTOR
Wizualizacja optymalnego dopasowania wielu sekwencji i konstrukcja sekwencji konsensusowych.
Konstrukcja szeregu sekwencji konsensusowych dla jednego zestawu dopasowanych sekwencji, przy zmiennych parametrach progowych.
Eksportowanie wyników w formacie rtf (MS Word).
MUTACJE SPRZĘŻONE
Zjawisko występowania mutacji wzajemnie zależnych. Jest to pozytywna selekcja jednej mutacji uwarunkowana pojawieniem się innej mutacji w innym miejscu.
Zgodnie z aktualną hipotezą pozytywnej selekcji darwinowskiej na poziomie molekularnym, mutacje sprzężone odnoszą się do obszarów będących w bezpośrednim kontakcie, związane są z interakcją białko-białko oraz mają na celu zachowanie ogólnych własności strukturalnych i funkcjonalnych cząsteczki (dotyczą elementów biologicznie aktywnego centrum w białku).
Przykład wzajemnego rozmieszczenia pozycji wykazujących sprzężenie mutacyjne (rodzina inhibitorów proteinaz typu Bowmana-Birk). Wąski klaster pozycji sprzężonych ( efekt domina ).
PROGRAM CORM
Program Corm
Lokalizacja i charakterystyka mutacji sprzężonych występujących w obrębie homologicznej rodziny białek.
http://tarawa.icm.edu.pl/agorecki/corm
PROGRAM HCA Plot
ęłęóAnaliza i przewidywanie struktury drugorzędowej białek.
PROGRAM PREDICT7
ęłęóKompleksowa analiza i przewidywanie teoretyczne właściwości białek na podstawie ich sekwencji aminokwasowej.
PROGRAM PROTEIN SEQUENCE ANALYSIS
PROGRAM ANTHEPROT (ANTHEWIN)
Przewidywanie struktury drugorzędowej.
Kompleksowa analiza i przewidywanie teoretyczne właściwości białek na podstawie ich sekwencji aminokwasowej.
ęłęóKompleksowa analiza i przewidywanie teoretyczne właściwości białek na podstawie ich sekwencji aminokwasowej. Koło helikalne.
PROGRAM RASMOL
ęłęóBiałkowe przeglądarki 3D.
PROGRAM SWISS PDB VIEWER
PROGRAM WEBLAB VIEWER ( ACCELRYS )
ANIMACJA W PRZEGLĄDARKACH MOLEKULARNYCH
USŁUGI ZDALNEGO NAUCZANIA I ZDALNYCH KURSÓW
ęłęóhttp://tarawa.icm.edu.pl/lulu/Bioserver.htm
ĆWICZENIE
w celu wykonania ćwiczenia, wykonaj następujące polecenia:
Wyszukaj i pobierz sekwencje aminokwasowe dla ludzkich glukokinaz z bazy sekwencji białkowych Swiss-Prot.
Jeśli znane są ich struktury przestrzenne, to pobierz je z bazy PDB.
Wykonanie ćwiczenia:
Otwórz stronę serwisu bioinformatycznego ExPASy,
Kliknij na łącze do sekwencyjnej bazy danych Swiss-Prot i otwórz stronę tej bazy,
W okno tekstowe wyszukiwarki wpisz słowa kluczowe "human glucokinase" i kliknij na przycisk "Go".
ęłęóStrona główna bazy sekwencji białkowych Swiss-Prot (i TrEMBL) z oknem tekstowym wyszukiwarki w górnej części ekranu.
W bazie Swiss-Prot znalezione zostaną trzy rekordy, z których dwa dotyczą ludzkich glukokinaz, a jeden jest rekordem białka regulatorowego ludzkiej glukokinazy. Oprócz nich znalezione zostaną dodatkowe dwa rekordy z bazy TrEMBL.
Warunki zadania spełniają dwa rekordy o kodach: ADPGK_HUMAN (Q9BRR6) oraz HXK4_HUMAN (P35557). Oba posiadają przekierowanie do danych na temat struktury trzeciorzędowej, przy czym rekord ADPGK_HUMAN (Q9BRR6) zawiera link jedynie do bazy ModBase (a nie do bazy PDB).
ęłęóWynik wyszukiwania ludzkiej glukokinazy w bazie sekwencji białkowych Swiss-Prot.
ęłęóFragment rekordu ADPGK_HUMAN (Q9BRR6) zawierający łącznik do strukturalnej bazy ModBase.
ęłęóWygląd rekordu struktury ludzkiej glukokinazy o kodzie Swiss-Prot Q9BRR6, pobrany z bazy strukturalnej ModBase.
Dopiero w strukturalnym rekordzie ModBase znajduje się informacja (i łącznik) o rekordzie pdb z danymi strukturalnymi dla tego białka. Podany jest także kod pdb tego białka (1ua4A).
Rekord bazy Swiss-Prot glukokinazy P35557 zawiera bogatszą informację strukturalną o tym białku. Znajdują się w nim łączniki zarówno do bazy ModBase, jak i bazy PDB.
ęęłęóWygląd rekordu (fragment) struktury ludzkiej glukokinazy o kodzie Swiss-Prot Q9BRR6 i kodzie PDB 1UA4, pobrany z bazy
struktur białkowych PDB.
ęęłęóFragment rekordu HXK4_HUMAN (P35557) zawierający łączniki do strukturalnej bazy ModBase oraz PDB.
Sekwencje pobrać można z rekordów bazy Swiss-Prot. Dla wygody użytkownika można od razu pobrać sekwencję zapisaną w formacie FASTA. Łącznik do tych danych znajduje się w końcowej części rekordu po prawej stronie.
Plik pdb ze strukturą przestrzenną białka pobrać można z rekordu bazy PDB, korzystając z łącznika "Download Files". Z tego samego miejsca można także pobrać sekwencję aminokwasową białka.
ęęłęóWygląd rekordu (fragment) struktury ludzkiej glukokinazy o kodzie Swiss-Prot P35557 i kodzie PDB 1GLK, pobrany z bazy
ęęłęóDolna część rekordu bazy danych Swiss-Prot z łącznikiem do sekwencji białka zapisanej w formacie FASTA.
ĆWICZENIE 1.2
ęęłęóW celu wykonania ćwiczenia, wyszukaj i pobierz graficzną reprezentację struktury przestrzennej dla białka o kodzie Swiss-Prot P02144.
ĆWICZENIE 2
ANALIZA TEORETYCZNA BIAŁEK W OPARCIU O ICH STRUKTURĘ PIERWSZORZĘDOWĄ
ANALIZA BIAŁEK NA POZIOMIE STRUKTURY PIERWSZORZĘDOWEJ
PODOBIEŃSTWO FUNKCJONALNE I SEMIGOMOLOGIA GENETYCZNA
ANALIZA SEKWENCJI BIAŁEK
Poznanie struktury pierwszorzędowej białka umożliwia jego głębszą analizę w aspekcie konformacyjnym i funkcjonalnym poprzez porównanie z bardziej poznanymi białkami wykazującymi homologię w sekwencji aminokwasowej.
Informacje uzyskiwane dzięki takiej analizie są znacznie bogatsze niż proste wykazanie stopnia identyczności.
W ciągu minionych dwudziestu lat opracowano znaczną ilość algorytmów do analizy sekwencji białek (jak również kwasów nukleinowych) i skonstruowano setki programów opartych na nich.
INTERPRETACJA GRAFICZNA
Uzyskiwane z porównania wyniki przedstawia się powszechnie za pomocą interpretacji graficznej, która jednoznacznie wykrywa i lokalizuje fragmenty homologiczne, miejsca insercji i delecji, oraz wielodomenową budowę białka (homologia wewnętrzna wynikająca z duplikacji, bądź multiplikacji genu kodującego dane białko). Przykłady takich wyników przedstawione są na następujących rysunkach.
Interpretację graficzną stanowi dwuwymiarowy diagram, w którym oś odciętych reprezentuje sekwencję jednego, a oś rzędnych drugiego z porównywanych białek. Na diagramie zaznaczane są punkty, których współrzędne odpowiadają numerom pozycji okupowanych przez identyczne reszty aminokwasowe w porówn...
xyzgeo