InterPro

InterPro
Content
DescriptionInterPro analizează funcțional secvențele de proteine și le clasifică în familii de proteine în timp ce prezice prezența domeniilor și a site-urilor funcționale.
Contact
Research centerEMBL
LaboratoryInstitutul European de Bioinformatică
Primary citationBaza de date interpro familii de proteine și domenii: 20 de ani[1]
Release date1999
Access
Websitewww.ebi.ac.uk/interpro/
Download URLftp.ebi.ac.uk/pub/databases/interpro/
Miscellaneous
Data release
frequency
8-săptămânal
Version83.0 (2 decembrie 2020; acum 3 ani, 6 luni și 4 zile (2020-12-02))

InterPro este o bază de date cu familii de proteine, domenii și site-uri funcționale în care caracteristicile identificabile găsite în proteinele cunoscute pot fi aplicate noilor secvențe de proteine[2] pentru a le caracteriza funcțional.[3][4]

Conținutul InterPro constă din semnături de diagnosticare și proteinele care se potrivesc semnificativ. Semnăturile constau din modele (tipuri simple, cum ar fi expresii regulate sau unele mai complexe, cum ar fi modelele Markov ascunse) care descriu familii de proteine, domenii sau site-uri. Modelele sunt construite din secvențele de aminoacizi ale familiilor sau domeniilor cunoscute și sunt utilizate ulterior pentru a căuta secvențe necunoscute (cum ar fi cele care decurg din secvențierea genomului nou) pentru a le clasifica. Fiecare dintre bazele de date membre ale InterPro contribuie la o nișă diferită, de la clasificări la nivel foarte înalt, bazate pe structură (SUPERFAMILY și CATH-Gene3D) până la clasificări subfamiliale destul de specifice (PRINTS și PANTHER).

Intenția InterPro este de a oferi un mulaj unic pentru clasificarea proteinelor, unde toate semnăturile produse de diferitele baze de date membre sunt plasate în intrări în baza de date InterPro. Semnăturile care reprezintă domenii, site-uri sau familii echivalente sunt introduse în aceeași intrare, iar intrările pot fi, de asemenea, corelate între ele. Informații suplimentare, cum ar fi o descriere, nume coerente și termeni ca ontologia genei (GO) sunt asociate cu fiecare intrare, acolo unde este posibil.

Referințe

  1. ^ Blum M, Chang HY, Chuguransky S, Grego T, Kandasaamy S, Mitchell A, et al. (noiembrie 2020). „The InterPro protein families and domains database: 20 years on”. Nucleic Acids Research: gkaa977. doi:10.1093/nar/gkaa977 Accesibil gratuit. PMID 33156333. 
  2. ^ Hunter S, Jones P, Mitchell A, Apweiler R, Attwood TK, Bateman A, et al. (ianuarie 2012). „InterPro in 2011: new developments in the family and domain prediction database”. Nucleic Acids Research. 40 (Database issue): D306–12. doi:10.1093/nar/gkr948. PMC 3245097 Accesibil gratuit. PMID 22096229. 
  3. ^ Apweiler R, Attwood TK, Bairoch A, Bateman A, Birney E, Biswas M, et al. (ianuarie 2001). „The InterPro database, an integrated documentation resource for protein families, domains and functional sites”. Nucleic Acids Research. 29 (1): 37–40. doi:10.1093/nar/29.1.37. PMC 29841 Accesibil gratuit. PMID 11125043. 
  4. ^ Apweiler R, Attwood TK, Bairoch A, Bateman A, Birney E, Biswas M, et al. (decembrie 2000). „InterPro--an integrated documentation resource for protein families, domains and functional sites”. Bioinformatics. 16 (12): 1145–50. doi:10.1093/bioinformatics/16.12.1145 Accesibil gratuit. PMID 11159333. 

Legături externe

  • Site web oficial — webserver
  • v
  • d
  • m
Bioinformatică
Databases
  • Baze de date secvențiale: GenBank, European Nucleotide Archive și DNA Data Bank of Japan
  • Baze de date secundare: UniProt, baza de date a secvențelor de proteine care se grupează Swiss-Prot, TrEMBL și Protein Information Resource
  • Alte baze de date: Protein Data Bank, Proiectul bazei de date a genomului Ensembl și InterPro
  • Baze de date genomice specializate: BOLD, Saccharomyces Genome Database, FlyBase, VectorBase, WormBase, Rat Genome Database, PHI-base, Arabidopsis Information Resource și Zebrafish Information Network
Software
  • BLAST
  • Bowtie
  • Clustal
  • EMBOSS
  • HMMER
  • MUSCLE
  • SAMtools
  • SOAP suite
  • TopHat
Altele
  • Server: ExPASy
  • Ontology: Gene Ontology
  • Rosalind (education platform)
Instituții
  • Broad Institute
  • China National GeneBank (CNGB)
  • Computational Biology Department (CBD)
  • Microsoft Research - University of Trento Centre for Computational and Systems Biology (COSBI)
  • Database Center for Life Science (DBCLS)
  • DNA Data Bank of Japan (DDBJ)
  • European Bioinformatics Institute (EMBL-EBI)
  • European Molecular Biology Laboratory (EMBL)
  • Flatiron Institute
  • J. Craig Venter Institute (JCVI)
  • Max Planck Institute of Molecular Cell Biology and Genetics (MPI-CBG)
  • US National Center for Biotechnology Information (NCBI)
  • Japanese Institute of Genetics
  • Netherlands Bioinformatics Centre (NBIC)
  • Philippine Genome Center (PGC)
  • Scripps Research
  • Swiss Institute of Bioinformatics (SIB)
  • Wellcome Sanger Institute
  • Whitehead Institute
Organizații
  • African Society for Bioinformatics and Computational Biology (ASBCB)
  • Australia Bioinformatics Resource (EMBL-AR)
  • European Molecular Biology network (EMBnet)
  • International Nucleotide Sequence Database Collaboration (INSDC)
  • International Society for Biocuration (ISB)
  • International Society for Computational Biology (ISCB)
    • Student Council (ISCB-SC)
  • Institute of Genomics and Integrative Biology (CSIR-IGIB)
  • Japanese Society for Bioinformatics (JSBi)
Întâlniri
  • Basel Computational Biology Conference‎ ([BC2])
  • European Conference on Computational Biology (ECCB)
  • Intelligent Systems for Molecular Biology (ISMB)
  • International Conference on Bioinformatics (InCoB)
  • ISCB Africa ASBCB Conference on Bioinformatics
  • Pacific Symposium on Biocomputing (PSB)
  • Research in Computational Molecular Biology (RECOMB)
Formate de fișier
  • CRAM format
  • FASTA format
  • FASTQ format
  • NeXML format
  • Nexus format
  • Pileup format
  • SAM format
  • Stockholm format
  • VCF format
Subiecte corelate
  • Computational biology
  • List of biobanks
  • List of biological databases
  • Molecular phylogenetics
  • Sequencing
  • Sequence database
  • Sequence alignment
  • Categorie
  • Commons Commons