I can't log in
 
LSI
Accions del document

Lectures de tesis doctorals

Anunci del darrer pas cap al doctorat: la lectura.

LogoDelicious  Digg!

 

Evolutionary Algorithms and de Novo Peptide Design

Doctorand: Ignasi Belda

Directors: Drs. Ernest Giralt i Fransesc Xavier Llorà

Tutoria: Dra. Angela Nebot

Resum: La present tesi adreça el problema biomèdic del disseny automàtic de lligands peptídics que s'uneixen a dianes terapèutiques proteiques. Per assolir aquest objectiu, utilitzem algorismes evolutius que fan evolucionar poblacions de pèptids. Els algorismes evolutius comencen la cerca amb un conjunt de pèptids aleatoris−individus−i, aleshores, aplicant les regles evolutives−supervivència del més fort, transmissió dels caràcters genotípics als descendents, etc−van explorant l'espai de cerca de manera implícitament paral·lela. La funció de fitness que determina el grau d'adaptació al medi de cada individu−és a dir, la funció a optimitzar−és l'energia lliure d'interacció entre el pèptid sent explorat i la proteïna diana. Aquesta energia s'obté a través de simulacions de docking pèptid-proteïna

En la present tesi s'estudien diferents implementacions dels algorismes evolutius i diverses extensions que poden incrementar llur potència de càlcul en certs escenaris, com els algorismes evolutius paral·lels, algorismes evolutius multimodals, tècniques d'herència de fitness, o evolució d'individus de mida variable. Finalment, la metodologia desenvolupada−ENPDA (Evolutionary de Novo Peptide Design Algorithm)−és aplicada al disseny de pèptids que puguin reconèixer importants dianes terapèutiques, com la proteïna p53, la prolil oligopeptidasa, la ADN girasa, el MHC H-2Kb, i un model de fibril·les ß amiloide (1-42).

Entre les extensions dels algorismes evolutius desenvolupades i provades cal mencionar, la paral•lelització a dos nivells realitzada sobre els algorismes evolutius, la qual aporta una escalabilitat quasi lineal; els algorismes evolutius multimodals, els que dirigeixen la cerca cap a un espai divers des del punt de vista molecular; les tècniques d'herència de fitness, que, teòricament, s'espera que aporten una gran acceleració al procés evolutiu, però no ha estat pas així en ENPDA, degut a les hipòtesis exposades més endavant; i l'evolució d'individus de mida variable, la qual prepara als algorismes evolutius a adaptar, dinàmicament, la mida dels pèptids dissenyats a la mida de la zona de la proteïna en que va a unir-se el pèptid.

D'altra banda, en aquesta tesi també es desenvolupa una tecnologia de mineria de dades per poder extreure nou coneixement de manera automàtica de bases de dades biomèdiques. La metodologia és aplicada i validada en dos conjunts de dades completament diferents: lligands peptídics i la base de dades de toxicologia de l'empresa AstraZeneca. En aquest procés d'extracció de coneixement s'utilitzen també algorismes evolutius per tal de fer evolucionar un conjunt de regles que descriuen i generalitzen els patrons observats. A continuació, s'apliquen una sèrie d'operacions computacionals per tal de detectar i filtrar les condicions significatives. I finalment, el conjunt de condicions significatives és interpretat i és el que conforma el cos del nou coneixement extret de manera automàtica.

Dia: 10 de març

Hora: 11:00h

Lloc: Aula Fèlix Serratosa

         Parc Científic de Barcelona.

         C/ Josep Samitier, 1-5

          08028 Barcelona.


Systematic Construction of Gola-Oriented COTS Taxonomies

Doctoranda:
Claudia Patricia Ayala Martínez

Director:
Dr. Xavier Franch

Resum: El procés de construir software a partir de l'assemblatge i la integració de solucions de software prefabricades, conegudes com components COTS (comercial-Off-The-Shelf) s'ha convertit en una necessitat estratègica en una àmplia varietat d'àrees d'aplicació. en general, els components COTS són components de software que aporten una funcionalitat específica, i que es troben disponibles al mercat per a ser adquirits i integrats dins d'altres sistemes de software. Els beneficis potencials d'aquesta tecnologia són, principalment, la reducció de costos i  l'escurçament del temps de desenvolupament, a la vegada que fomenten la qualitat. Tot i així, nombrosos reptes que van des de problemes tècnics i legals han de ser  afrontats per a adaptar les activitats tradicionals d'enginyeria de software per explotar els beneficis de l'ús de COTS per al desenvolupament de sistemes.

Actualment, existeix un incrementalment enorme mercat de components COTS; així doncs, una de les activitats més crítiques en el desenvolupament de sistemes basats en COTS és la selecció de components que han de ser integrats en el sistema a desenvolupar. La selecció és bàsicament composta per dos processos principals: La recerca de components candidats al mercat i la seva posterior avaluació en referència als requisits dels sistema. Desafortunadament, la majoria dels mètodes existents per seleccionar COTS, estan enfocats en el procés d'avaluació, deixant de banda el problema de buscar els components al mercat. La recerca de components al mercat no és una tasca trivial, i ha de fer front a diverses característiques del mercat de COTS, com la seva naturalesa dispersa i sempre creixent, o el canvi i l'evolució constant; en aquest context l'obtenció d'informació de qualitat relacionada amb els components no és una feina fàcil. Com a conseqüència, el procés de selecció COTS es veu seriosament afectat. A més, les alternatives tradicionals de reutilització també manquen de solucions apropiades per reutilitzar components COTS i el seu coneixement adquirit a cada procés de selecció. Aquestes mancances de propostes és un problema molt seriós que incrementa els riscos dels projectes de selecció de COTS, a més de fer-los ineficients i altament costosos.

Aquesta dissertació presenta el mètode GOThIC (Goal-Oriented Taaxonomy and reuse Infraestructure Construction) enfocat a la construcció d'infraestructures de reutilitzament per a facilitar la recerca i reutilitzament de components COTS. El mètode està basat en l'ús d'objectius per a construir taxonomies abstractes, ben fonamentades i estables per a lidiar amb les característiques del mercat de COTS. Els nodes de les taxonomies estan caracteritzats per objectius, les seves relacions són declarades com a dependències i diversos artefactes són construïts i gestionats per a promoure la reutilitzabilitat i lidiar amb l'evolució constant.

El mètode GOThIC ha estat elaborat a través d'un procés iteratiu d'investigació-acció per a identificar els reptes reals relacionats amb el procés de recerca de COTS. Posteriorment, les solucions possibles varen ser avaluades i implementades en diversos casos d'estudi a l'àmbit industrial i acadèmic en diversos dominis. Els resultats més rellevants varen ser enregistrats i articulats en el mètode GOThIC. L'avaluació industrial preliminar del mètode s'ha dut a terme en algunes companyies de Noruega.

Dia:
31 de març

Hora:
12:00h

Lloc:
Sala D'actes de la Facultat d'Informàtica de Barcelona.
         Edifici B6. Campus Nord.

A Flexible Multitask Summarizer for Documents from Different Media, Domain and Language

Doctoranda: María Fuentes Fort

Director: Dr. Horacio Rodríguez Hontoria

Resum: El resum automàtic és probablement crucial en un moment en què la gran quantitat de documents generats diàriament fa que recuperar, tractar i assimilar la informació que contenen s'hagi convertit en una dura, i a la vegada decisiva tasca. Tot i així, no podem esperar que els resums produïts de forma automàtica siguin capaços de substituir als humans. El procés de resum automàtic no només depèn de les característiques pròpies dels documents a ser resumits, sinó que és fortament dependent de les necessitats específiques dels usuaris. Per això, el disseny d'un sistema d'informació per a resum comporta tenir en comte diversos aspectes. en funció de les característiques dels documents d'entrada i dels resultats desitjats és possible aplicar diferents tècniques. Per aquesta raó sorgeix la necessitat de dissenyar una arquitectura flexible que permeti la implantació de múltiples feines de resum. Aquest és l'objectiu final de la tesi que presento dividit en tres subtemes de recerca.

En primer lloc, estudiar el procés d'adaptabilitat de sistemes a diferents tasques de resum, com són processar documents produïts en diferents llengües, dominis i medis (so i text), amb la voluntat de dissenyar una arquitectura genèrica que permeti la fàcil incorporació de noves tasques a través de reutilitzar eines existents.

En segon lloc, desenvolupar prototips per diferents tasques, tenint en comte aspectes relacionats amb la llengua, el domini i el medi del document o conjunt de documents que requereixen ser resumits, així com aspectes relacionats amb el contingut final del resum: genèric, novetat o resum que doni resposta a una necessitat específica.

En tercer lloc, crear un marc d'avaluació que permeti analitzar la competència intrínseca de diferents prototips.

Dia:
31 de març

Hora:
9:00h

Lloc:
Aula de Teleensenyament de l'edifici B3.
        Campus Nord.


Contacte premsa:
ilapuente@lsi.upc.edu

 
Darrera modificació: Març 2008
© UPC. Technical University of Catalonia
Departament de Llenguatges i Sistemes Informàtics
About this web.