Presentacions a classe
- Sessió Suffix-trees
Fonaments de Genètica
Molecular
El primer capítol del llibre [SM97] conté una bona
introducció, que es pot completar amb [AP99] i [BO98].
També podeu accedir a les adreces WEB:
- http://www.accessexcellence.org/AB/GG/
- http://www.nhgri.nih.gov/DIR/VIP/Learning_Tools/
Alineament de dues seqüències
Tots els llibre tractan aquest tema. Una explicació detallada
pas a pas de l'algorisme de Needleman-Wunsh es pot trobar a
http://www.ibc.wustl.edu/CMB/bio5495/dynamic/dynamic.html
Sessió 1 de laboratori:
Connecteu-vos a "http://www.lsi.upc.es/~alggen":
- Amb el programa DOTLET (opcio DOWNLOADED TOOLS)estudieu les seguents sequencies:
>transposo1
AATAGTATTGAGACCAAAAAAATTGATTAATTTAGAGAGATATTAATTTATCGATAAACTAATAAAATTGTACAAATTTGTAAATTCTTACCAAAATTCTATAAAAAGTGTAGTTTTTTCTTTATAATCAATAGTAATTACAAGTAAAAAGCAATTATTAAATTTAAAAAACAATACAATTTTTTTTTATGTTGTAAAATACTAGAATTGAACACTATAAAAAATTAATAAAAATTGAAGAAAACAATTAGTACAGCCATATTTTACATATGATATTTATAATATATATTAGTAAATTTATAAAATTATTAATTTATACTATTGATGGGAGCATATATTTATATAAGATTTTCAATAAAAATATTATCTTATTAGTTTATCGATTTATATCAATTTTTATATTGGTCTCAACTCTGCACCAAAAAAAATTATTAATTTATAAAAATTATTAATTTATCGAATATT
>transposo2
AATAATATTTGGACCAATAAAATTTATTAATTTAGAGAGGTATTAATTTATCGATAAATAAATAAAATTGTACAAATTTTGTAAATTCTTACAAAAATTCGATATAAAATATAGTTTTTTTCCCTATAATCAATAGTATTTCTAAAACCAATTACAAGTAGAAAGCAATTATTAAGTTTGAAAAACAATACAATTTTTTCGATATTGTAAAATATTAGAATTGAACACTACAAAGAATTAACAAAAATTGAAGAAAAACATTACTAGACTCATATTTTACATATGATATTTATAATATATATTGATAAATTTATATAATTATTAATTTATACTATTGATGGACCATATAATTATATAAGATTTTCAAAAATATTATTATCTTATTAATTTATCGATTTTTATCAATTTTTACATTGGTCCCAACTTGCTCAGAATCTGTGCTCATTCTTATGCATTCTAAAGAACTTGCTCAGACTCTCTGCTCATTACAGCAAAACTTCTATAAATTAATACTTGAAAAATTTATTAATTTTTCAAGTATT
>transposo3
AATACTCGATAAATTAATAATCTCTATAAATTAATAAATTCTTCCGGTTCCGAGTTGGGACCAGTGTAAAAAGTAACACAAATCGATAAATTAATAAGATAATAATTTTTTTTAAAGTCTTATGTAAATATATGGTCCCATCAATATTATAAATTAATAATTGCATAAATATATCAATTATATATATACATTATATGTAAGAAATTTCTTTGAAACATATTTCTAATATTGTTTTGCTTAAATTTGTATTTATTCTTATTTGAAATTTAATTCTAATATGTTACTGTATCAAAAACTTTTACTGTTGTTTTCTATACATGATATTATTTTTAACTTGTAATTGATTCTACAAAGATATTTTCTAGAAAAAAGAATCTTATAGAAATGTTTTAAAAGTTACTAAATTAGGAAAGTCTCTCTATAAAATTTATTAATTTATCGATAAATTAAAACCTCTCTAAATTAATAAAATTTTACAATCCCAACATTATT
- Per entendre l'algorisme de
programació dinàmica aneu TEACHING, EMBER i executeu
LEPA que es un "Comparador
global, semiglobal i local de dues seqüències de ADN" fet per Raimundo
Benítez i Jose Ramón Moya."
- Alinieu globalment les seqüències: acggtac amb aggac
(podeu conjecturar el resultat?)
- Alinieu globalment les
seqüències: gtacccg amb acggtac (podeu conjecturar el
resultat?)
L'aliniament global no és l'opció més
indicada. Proveu el semiglobal.
- I si proveu el semiglobal canviant l'ordre de les
seqüències?
- Canvieu al programa "Comparador global i semiglobal de dues
seqüències de ADN" de Miguel A. Martínez i estudieu quina és la
millor forma d'linear les seqüències :
atcatgaa ctcgaggcgg tcccggggca ggaaagagc
tggcaagcac gtggtggggc ccctgaggtg tgcagagggt cgcgcaccta gaagcctgtc
gctggcacgg tctgggcggg aggttctgcg gcgggaggca gcctgttggt tgcagggctg
aaaaagcagt tctacaaggc aagccagctg gtcagtgaga aggtcggagg gtctgagggg
accaagctgg acaatgactt caaagagatg gagatgtcat cagcaaggcg gtgacggaaa
ttctggcaag gaccatcaag tacctgacag cccaacccag cctcacaggc taagctgacc
atgctcaaca cagtgtgcaa gatccagggc caggtgaaga accccggcta cccgcagttg
gaggggctcc tgaacgagtg cctgatccgc caccagaaag agctgggcaa cgagtccaac
ttcagtgatg cactgctgga tgccggcgag tccatgaagc acctggcaga ggtg
gcgcga cgagtccaac
ttcagcgatg cactgctgga tgccggcgag cccatgaagc acctggcaga ggtgaaggac
tccctggaca tagaggtcaa gcataacttc attgaccccc tccagaacct atgtgagaaa
gacctgaagg agatccagca ccacctgcag aagctggagg accgccgcct ggactttgac
taaaagaagc ggcagggcaa gatccccgaa gaggagctgc acaaggcgct ggagaagttt
gaggagtcca aggaggtggc agaaaccagc atgcacaacc tcctggagac cgacat
- I si intentessiu alinear cadascuna de les anteriors amb la següent
tgtgtaatct ttaaagcata ttgaaaaatt actattctca agtaaggata atgtatatct
caggtcactt acagtctcaa agttttgtca gtatacttta aaacaatcct gcgaacagat
ctagattgaa ggagactaaa gaatcatgaa ctcgaggtgg ccccggggca ggcgcagagc
tggcaagcac gtggtggggc ccctgaggcg tgcagagggt cacgcacctg ggagcctgtt
gctggcacgg tccgggcggg aggttctgcg gcgggaggca gcctgtcggt tgcagggctg
aaaaagcagt tctacaaggc aagccagctg gtcagtgaga aggtcggagg gactgagggg
accaagctgg acgatgactt caaagagatg gagatgtcat cagcaaggcg gtgacggaaa
tgctggcaag gaccatcaag tacctgagag cccaacccag cctcacaggc taagctgacc
atgctcaaca cagtgtgaaa gatccagggc caggtgaaga accccggcta cccgcagtcg
gag
Aliniament múltiple
Sessió 2 de laboratori:
- Creeu un fitxer en format FASTA amb les tres
seqüències
del problema anterior i executeu MALIG
- I ara un cas real, amb quatre sequencies
GACTACAGTTAAACCTCTATAAATTAATATTCGATAAATTAATAAATTCTTTCAGTCCCGAGTTGG
GACCAATGTAAAAATTGATACAAATCGATAAATTAATAAGATAATAACTTTTTTGAAAATTTTATA
TAAACGTATGGTCTCTTTAATATCATAAATTAATAATTGTATAAATACATCAACTATATATATAAA
TATATATTATATGTAATAAACTTCAATGATATAGAATTCATTGGTTTTTTTTTCTTCTTAAATTTG
TATTAGTTCTTGTTTGAATTTAGCTCTATTATTCTTACTATATCAAAAAAATTTGGTATTGTTTTT
AGACATAATTATTATTTTTACTTATAATTTGTTCTAAAAGTATATTTTATATAATGAAAGAAATAT
AATATTTTCATATAAAAATAAAAAATTAGAAAATTAAGAAAATCTCTCTATCGATAAATTGAAACC
TCTATAAATTAATAAAATTTTGCGGTCCCAAAGTTATTAATTTATAGAGGTTTACTATATT
AGCTACAGTAGAAACTCTATAAATTAATACTCGATAAATTAATAAACACGATAAATTAATAAATTTT
ACCGGTCCCAAGTCGGGCCAATGTAAAAAGTAACCAAAATCGATAAGATAATAAGATAATATTTTTT
TTGAAATCCCTATATAAAATTATAGTCCCAATAATATTATAAATTAATAATCATAGATCTTAAGTAT
ATATTTTAAGACTAATTAATTTTTATATGAAATTTTTGTTCAAAGTACAATTACAACTCTTTTTAAA
ATATAACTGGTATGATCTCTGTTGTACTCACATAACTATTTGCGTATTTGATCTGTCATAGTTGATT
TTGTAAAATCTTTTATTTGAAAAAGCATTGCTAAGATTTGTGTAAATAAAAATTGGATTAAACTTCA
TGTTTACGTTTACGTTCACGTTAATGTCGTGGATATACAAACACAATATATTTTGAAAAATAAATTT
AAAAAGTCAAAGAAAAATAAAAAACTAACATAATTATATATACAAACAACAAAGCATATAGAAAATT
AATTAAAAACATTTTAAAAAGAATATAGTATTGTATTTTACATAAATATTTTTATAAATTAATATTT
ATTAACTTATACGATAAATTAATAAATATTAATTTATAGGATAAATTAATATCACTATAAATTAATA
AAATTTCATGGTCCCAACATTATTAATTTATAGAGTTTCTACTGTATAT
AGGTACAGTAGAAACTCTATAAATTAATAATGTTGGGACCATGAGATTTTATTAATTTATACTGATA
TTAATTTATTCTATAAATTAATAAATATTAATTTATAGGTTAAAAAATAAATATTAATTTATAGAAA
TATTTACGTAAAATACAATACTAAATTCTTTTAAAAATGTTTTTTAATTTAGTTTTTCTTATGTTTT
GTTGTTTTTATATTCAATTATGTTAAAAAAAATATTTTTCTCTTGACTTTTTAATTTATTTTCCTAC
AAAATATTGTGTCCGTTTTATTTACGACGTTAACACGAGGGTTAATCCAATTTTTCTTTGTACAAAT
CTTAACAATGATTAAAAAATGTTACAAAACCAAATATGACAGATAAATACGCAAACAGTTATGTGAG
TACAAAAAAGATCATACCAACTGTACTCTAGAAAGAGTTGTAATTGTGGTTTGAATAAAATAATCAT
ATAAAATTAGTGTTAGAATATATGCTTAAGATTTATGATTATTAATTTATGATATTATTGGGACCAT
ATTTTTACATAGGGATTTCAAAAAAAATATTATCTTATTATCTTATCGATTTTGGTTAATTTTTACA
TTGACCTGACCTTGGGACCAGCAAAATTTATTAATTTATCGTGTTTATTAATTTATCGAATATTAAT
TTATAGAGTTTCTACTGTAGTA
TTATACAGTATAACCTCTATAAATTAATACTCTATAAATTAATAACTTCTATAAATTAATAAATTTTTC
CGGTCTTAAGTTGGAACCAGTGTAAAAAGTGACACAAACGATAAATTAATATGATAATAATTGTTTTGA
AAGTTTTATGTAAATATATGGTCCCATCAATATCGTAAATTAATAATTGTATAAATGTATCAACTACAT
ATATATTATATGTAAAACATAAAACATTTCCTTATAATATATTTTTAATATTTTTTTGCTTAAATTCAT
ATTTGTTCTTTGTTTGAATATAATTATCATAGTTTACTGTATCAAAACTGTTGGTGTTGTTTGTAGACA
TTATTATTATATTTTCAATAATGAAAGAAATTTTATAGAAATTTTTAAAAAGTTACCAAAATTTTGAAA
ATCTTTTTATAAATTAATAAATATTAATTTATCGATAAATTAATACCTTTCTAAATTAATAAAATTTTG
TAGTCCCAATATTATTAATTTATAGAGATTTTACTGTATAT
- El programa mes utilitzat per fer aliniaments múltiples
és CLUSTAL (http://www.ebi.ac.uk). Repetiu els aliniaments
i compareu amb MALIG.
Cerca en Bases de dades
Tots els llibre tractan aquest tema.
Sessió 3 de laboratori:
Connecteu-vos a
http://www.ncbi.nlm.nih.gov/Genbank/GenbankSearch.html i esbrineu amb
el programa BLAST que són les següents
seqüències:
- AACAATGTTGGGACTGTAAAAATTTATTAATTTAGAAAGATATTAATTTATCGATAAATTAATAATTATTA
ATTTATAGAAAGATTTTATAAATTTTGTAATTTTCTTACAAAAATTCGATATAAAAATTAGTTTTTTCTTT
ATAATCAATAATTTTTCTAAAACTAATTACAAGCAAAAAACAATTCTTAAGTTTAAAAAATAATACAAACT
TTTTCGACGTAATAATAAGATTGGAATTAAACTCTACATATAATTAATAGAAATTGAAGAAAAATAATACT
AGAATCATATTTCAATAAATATTTTACATATAATATTGATATATATATGTGTATATATTATAATATTGATG
TGACCATATATTTATATAGGATTTTCAAAAAAGTTATTATCTTATTAATTTATCGATATGTATCAATTTTT
ATACTGGTCCCAACTCGGGAATGAAAGAATTTATTAAATTATAGAGATTATTATTCTATAGAGTATT
- GCGGCCGCGGCGCGTGCGTCTGTGCCTCTGCGCGGGTCTCCTGGTCCTTCTGCCATCATGCCGATGTTCA
TCGTAAACACCAACGTGCCCCGCGCCTCCGTGCCGGACGGGTTCCTCTCCGAGCTCACCCAGCAGCTGGC
GCAGGCCACCGGCAAGCCCCCCCAGTACATCGCGGTGCACGTGGTCCCGGACCAGCTCATGGCCTTCGGC
GGCTCCAGCGAGCCGTGCGCGCTCTGCAGCCTGCACAGCATCGGCAAGATCGGCGGCGCGCAGAACCGCT
CCTACAGCAAGCTGCTGTGCGGCCTGCTGGCCGAGCGCCTGCGCATCAGCCCGGACAGGGTCTACATCAA
CTATTACGACATGAACGCGGCCAATGTGGGCTGGAACAACTCCACCTTCGCCTAAGAGCCGCAGGGACCC
ACGCTGTCTGCGCTGGCTCCACCCGGGAACCCGCCGCACGCTGTGTTCTAGGCCCGCCC
-
ctgctttctt cttgaccatt agtggatagg aaaaaaatgc tctgattttc tgtaaccatt
tgtcaccaaa gccataaaga cattgaacta atttccttat tggagttcat tattggaagt
cttgaggggt ttacacattt atctacaaag taagtaagcc agctcatttg tcttgactca
tgtgtaatct ttaaagcata ttgaaaaatt actattctca agtaaggata atgtatatct
caggtcactt acagtctcaa agttttgtca gtatacttta aaacaatcct gcgaacagat
ctagattgaa ggagactaaa gaatcatgaa ctcgagg-gg -cccggggca ggc--agagc
tggcaagcac gtggtggggc ccctgagg-g tgcagagggt c-cgcacct- g-agcctgt-
gctggcacgg tc-gggcggg aggttctgcg gcgggaggca gcctgt-ggt tgcagggctg
aaaaagcagt tctacaaggc aagccagctg gtcagtgaga aggtcggagg g-ctgagggg
accaagctgg ac-atgactt caaagagatg gagatgtcat cagcaaggcg gtgacggaaa
t-ctggcaag gaccatcaag tacctga-ag cccaacccag cctcacaggc taagctgacc
atgctcaaca cagtgtg-aa gatccagggc caggtgaaga accccggcta cccgcagt-g
gaggggctcc tgaacgagtg cctgatccgc caccagaaag agctg-gc-a cgagtccaac
ttcag-gatg cactgctgga tgccggcgag -ccatgaagc acctggcaga ggtgaaggac
tccctggaca tagaggtcaa gcataacttc attgaccccc tccagaacct atgtgagaaa
gacctgaagg agatccagca ccacctgcag aagct-gagg -ccgccgcct ggactttgac
taaaagaagc ggcagggcaa gatccccga- gaggagctgc -c-aggcgct ggagaagttt
gagga-tcca aggaggt-gc agaaaccagc atgcacaacc tcctggagac cgacattgag
cagatgagtc aactccgggc cctggcggag gcgcagctga acgaccactg gcaggccatg
cagatcctgg acgagctgga agagaagctc aagcgcagga tgcgggaagc ttcctcacgc
cccaagcggg agtataagcc caagttctgg gag--ctttg acctcgga-a gcctgagcag
tccaac-ggg gcttcccctg caccacagtc cccaa-atcg cagcttc-tc c-ctttcc-a
tctt-c-aca agtccatctg -actcctagc aggagcatgc cgcccctaga ccagcc-agc
tgcaagg--c tgtatgactt --agcc-gag aa-cat-ggg agctgggctt ccatgagggc
ga-gtcttca -gctgatcaa ccagatgaac gagaactgat acgagggcat gctggacggc
cagtcgggct tcttcctgct cagctatgtg gacgtgctcg tgcctctgcc cagtgactta
ggggggcccc cgccctgccc ctccatccac actgggtggc accccctgct gggtatcctg
ccttccacgg ggcccctgct gccagggcag tgtccaagcc tgctggcgcc acccaggccg
gggcccttga ggtactccct gagcagggct ccacacttgg gtggggggct tatctgggtg
ggtggagatg catgtttaca ctagcggctg atccccaaca gtgacggctc ccttccccac
tccatggcgc cggcctcctc cccgctcccc aactccttgc ccagctggct gaggcagagc
aacactaagg tgctctcaga aacactaac
Engalçament de sequencies
Tots els llibre tractan aquest tema.
Sessió 5 de laboratori:
Connecteu-vos a alggen
i esbrineu amb
elS programES ESSEM i MALIG com s'acoblen aquestes seqüències:
-
>seq1
TTGATACAAATCGATAAATTAATAAGATAATAACTTTTTTGAAAATTTTATA
TAAACGTATGGTCTCTTTAATATCATAAATTAATAATTGTATAAATACATCAACTATATATATAAA
TATATATTATATGTAATAAACTTCAATGATATAGAATTCATTGGTTTTTTT
-
>seq2
TATATATTATATGTAATAAACTTCAATGATATAGAATTCATTGGTTTTTTTTTCTTCTTAAATTTG
TATTAGTTCTTGTTTGAATTTAGCTCTATTATTCTTACTATATCAAAAAAATTTGGTATTGTTTTT
AGACATAATTATTATTTTTACTTATAATTTGTTCTAAAAGT
-
>seq3
ATTTAGCTCTATTATTCTTACTATATCAAAAAAATTTGGTATTGTTTTT
AGACATAATTATTATTTTTACTTATAATTTGTTCTAAAAGTATATTTTATATAATGAAAGAAATAT
-
>seq4
CGTATGGTCTCTTTAATATCATAAATTAATAATTGTATAAATACATCAACTATATATATAAA
TATATATTATATGTAATAAACTTCAATGATATAGAATTCATTGGTTTTTTTTTCTTCTTAAATTTG
Cerca de Factors de Transcripcio
Sessió 6 de laboratori:
Connecteu-vos a alggen
i executeu PROMO
-
>alpha_cardiac_actin_human_-360_to_-15
CTGCGGAGGACCGAATCCACAGACCATCCAGGGAGCACCCACACCCCAGAAAGGGGGAGGGGTGGGCTGGCGTCACTTAGTCTTCCCCTGCCCCCTACCCTTCAGCGCCTGCCCCTCCCCAGCTCCCTATTTGGCCATCCCCCTGACTGCCCCCTCCCCTTCCTTACATGGTCTGGGGGCTCCCTGGCTGATCCTCTCCCCTGCCCTTGGCTCCATGAATGGCCTCGGCAGTCCTAGCGGGTGCGAAGGGGACCAAATAAGGCAAGGTGGCAGACCGGGCCCCCCACCCCTGCCCCCGGCTGCTCCAACTGACCCTGTCCATCAGCGTTCTATAAAGCGGCCCTCCT
-
>alpha_cardiac_actin_mouse_-360_to_-12
TTGGAAGGGCTGAAGAGCAATAAGCCCACTCCACAACTAGGGAGCTCCCCCACCCAAGGGGCGCATTGGCATCACATAGCCTTTCCCCGTCCCCCACCCCTTGCTGGCCTGCCCCTCCCTAGCTCCCTATATGGCCATTGCTCTGACTGCCCCCTCCCCTTCCTTACATGGTCTGGGAGCCCCCTGGCTGATCCTCTACCCTGCCCTTGGCTCCAAGAATGGCCTCAGCGGTCCTAGATGGTGCTAAGGCGACCAAATAAGGCAAGGTGGCAGATCAGGGGCCCCCCACCCCTGCCCCCGGCTGCTCCAACTGACCCCGTCCATCAGAGAGCTATAAAGCTGCGCTCCA
-
>alpha_cardiac_actin_chicken_-335_to_-24
ACGCCCCGCGTGAAGGCCACCCGGGCCCGACATCTCGGGCAGCGCACCTGGCTTACACTTCCTCGAGGGACCATGAGGGCCACAGAAGAACTCCGAGCCTCCCCTCCCACCACGTCGGCGGAGGCTCCCTATTTGGCCATGTGGCGGCGGXXXXXXXXXXXXTCCGCACCTGCCTTAGATGGCCGGACAGCCGCGCCGCCTTGCGCCATTCATGGCCGCGCTGCGCCGCCATGGCGCCGAGCCGGCCAAATAAGAGAAGGTGGCTGCCCCGGCCCGCGGACCGCGGCCGCCGGGGGCTATAAAGCGGCAGCTTC
-
>alpha_cardiac_actin_frog_-355_to_-14
AGTCCCCCTGCACAATTGTGCTGCACCTGTCTACTCCATTTGCAGACCCCTGTGTCTGTGCAAACTATTTCTTTCATTGTGCTGTTTTTTTTGTCACCCAGCATTACAGACATGCTTTTTTGGGAATCCCTATTTGGCCATCCCTAGTAGTGCTCCCXXXXXXXXXXXXXXTTTCCATACATGGGCTAAGGGGTCCAAAGACCCTGCCCTCCCCCCTCACCTACTCCATTAATGGCTTCTTTGCTTTTCAATGGCCAGAAGCTACCAAATAAGGGCAGGCTGCCTGCCTTTCGGAGCTCCCACTGACTCCTCAACTCCAGGCAGCGTATAAATTGACAGCTCA
------------------------------------------------------------------
Bibliografia recomanada
i lleugerament comentada per als
alumnes de carreras tècniques que cursen l'assignatura
[Lew98]: Genes VI
de Benjamin Lewin (1200 pàg.). Oxford
University Press, 1998. ISBN 0192690655
Per a qui vulgui aprofondir
en els conceptes biològics que es tractan durant el curs.
[SM97]: Introduction to Computational Molecular Biology
de Joäo Setubal i Joäo Meidanis (280 pàg.). PWS
Publishing Company, 1997. ISBN 0534952623
És un llibre molt recomanable per als informàtics que es
vulguin introduir en la bioinformàtica. Cal tenir en compte que
com es un llibre introductori fet l'any 97 no inclou temes que avui en
dia estan molt d'actualitat.
[AP99]: Introduction to Bioinformatics
de Teresa
K. Attwood i David J. Parry-Smith (210 pàg.). Addison Wesley
Longman, 1999. ISBN 0582327881
És un llibre seriós de divulgació
científica sobre un tema d'actualitat.
[BO98] Bionformatics: a practical guide to the analysis of genes and
proteins
de Andreas D. Baxebanis i Francis Oullette (370
pàg.). John Wiley & Sons, 1998. ISBN 0471324418
És un llibre més complet que [SM97] pel que respecta als
continguts de genètica molecular però menys complet
quant a continguts algorísmics. El seu garn interé rau
en les referencies actualitzades de Internet que ofereix per a cada tema que
tracta.
[Wa95] Introduction to Computational Biology
de
M.S. Waterman. Chapman & Hall, 1995.
[
Go to Personal Home Page |
Go to LSI-IT Home Page |
Go to LSI Home Page |
]
messeguer@lsi.upc.es
Ultima actualització 10 de setembre de 1997