Bioinformatique structurale
La bioinformatique structurale est la branche de la bio-informatique liĂ©e Ă l'analyse et Ă la prĂ©diction de la structure tridimensionnelle des macromolĂ©cules biologiques telles que les protĂ©ines, l'ARN et l'ADN. Elle traite des gĂ©nĂ©ralisations sur les structures tridimensionnelles des macromolĂ©cules, telles que les comparaisons des repliements globaux et des motifs locaux, les principes du repliement molĂ©culaire, l'Ă©volution, les interactions de liaison et les relations structure/fonction, en travaillant Ă la fois Ă partir de structures rĂ©solues expĂ©rimentalement et de modĂšles informatiques. Le terme structural a la mĂȘme signification qu'en biologie structurale, et la bio-informatique structurale peut ĂȘtre considĂ©rĂ©e comme faisant partie de la biologie structurale computationnelle. L'objectif principal de la bio-informatique structurale est la crĂ©ation de nouvelles mĂ©thodes d'analyse et de manipulation de donnĂ©es macromolĂ©culaires biologiques afin de rĂ©soudre des problĂšmes de biologie et de gĂ©nĂ©rer de nouvelles connaissances[1].
Introduction
Structure des protéines
La structure d'une protĂ©ine est directement liĂ©e Ă sa fonction. La prĂ©sence de certains groupes chimiques Ă des endroits spĂ©cifiques permet aux protĂ©ines d'agir comme des enzymes, catalysant plusieurs rĂ©actions chimiques[2]. En gĂ©nĂ©ral, les structures protĂ©iques sont classĂ©es en quatre niveaux : primaire (sĂ©quences), secondaire (conformation locale de la chaĂźne polypeptidique), tertiaire (structure tridimensionnelle du pli protĂ©ique) et quaternaire (association de plusieurs structures polypeptidiques). La bio-informatique structurale traite principalement des interactions entre les structures en tenant compte de leurs coordonnĂ©es spatiales. Ainsi, la structure primaire est mieux analysĂ©e dans les branches traditionnelles de la bio-informatique. Cependant, la sĂ©quence implique des restrictions qui permettent la formation de conformations locales conservĂ©es de la chaĂźne polypeptidique, telles que l'hĂ©lice alpha, les feuillets bĂȘta et les boucles (structure secondaire[3]). De plus, les interactions faibles (telles que les liaisons hydrogĂšne) stabilisent le repliement des protĂ©ines. Les interactions peuvent ĂȘtre intra-chaĂźne, c'est-Ă -dire lorsqu'elles se produisent entre des parties du mĂȘme monomĂšre protĂ©ique (structure tertiaire), ou inter-chaĂźne, c'est-Ă -dire lorsqu'elles se produisent entre diffĂ©rentes structures (structure quaternaire).
Visualisation de la structure
La visualisation de la structure des protĂ©ines est un enjeu important pour la bio-informatique structurale[4]. Il permet aux utilisateurs d'observer des reprĂ©sentations statiques ou dynamiques des molĂ©cules, permettant Ă©galement la dĂ©tection d'interactions qui peuvent ĂȘtre utilisĂ©es pour faire des infĂ©rences sur les mĂ©canismes molĂ©culaires. Les types de visualisation les plus courants sont :
- Cartoon : ce type de visualisation des protĂ©ines met en Ă©vidence les diffĂ©rences de structure secondaire. En gĂ©nĂ©ral, l'hĂ©lice α est reprĂ©sentĂ©e par un type de vis, les brins ÎČ par des flĂšches et les boucles par des lignes.
- Lignes : chaque résidu d'acide aminé est représenté par des lignes fines, ce qui permet un faible coût de rendu graphique.
- Surface : dans cette visualisation, la forme externe de la molécule est représentée.
- Bùtonnets : chaque liaison covalente entre les atomes d'acides aminés est représentée par un bùtonnet. Ce type de visualisation est le plus utilisé pour visualiser les interactions entre les acides aminés.
Structure de l'ADN
La structure classique des duplex d'ADN a été initialement décrite par Watson et Crick qui se sont appuyés sur les travaux de Rosalind Franklin. La molécule d'ADN est composée de trois substances : un groupe phosphate, un pentose et une base azotée (adénine, thymine, cytosine ou guanine). La structure en double hélice de l'ADN est stabilisée par des liaisons hydrogÚnes formées entre les paires de bases : l'adénine avec la thymine (AT) et la cytosine avec la guanine (CG). De nombreuses études de bio-informatique structurelle se sont concentrées sur la compréhension des interactions entre l'ADN et les petites molécules, ce qui a été la cible de plusieurs études de conception de médicaments.
Interactions
Les interactions sont des contacts établis entre des parties de molécules à différents niveaux. Ils sont responsables de la stabilisation des structures protéiques et exercent une gamme variée d'activités. En biochimie, les interactions sont caractérisées par la proximité de groupes d'atomes ou de régions de molécules qui présentent un effet les uns sur les autres, tels que les forces électrostatiques, la liaison hydrogÚne et l'effet hydrophobe. Les protéines peuvent effectuer plusieurs types d'interactions, telles que les interactions protéine-protéine (PPI), les interactions protéine-peptide[5], les interactions protéine-ligand (PLI)[6] et l'interaction protéine-ADN.
Calculer les contacts
Le calcul des contacts est une tùche importante en bio-informatique structurale, étant important pour la prédiction correcte de la structure et du repliement des protéines, de la stabilité thermodynamique, des interactions protéine-protéine et protéine-ligand, des analyses d'amarrage et de dynamique moléculaire, etc[8].
Traditionnellement, les méthodes de calcul ont utilisé la distance seuil entre les atomes (également appelée cutoff) pour détecter d'éventuelles interactions[9]. Cette détection est effectuée en fonction de la distance euclidienne et des angles entre atomes de types déterminés. Cependant, la plupart des méthodes basées sur la distance euclidienne simple ne peuvent pas détecter les contacts occlus. Par conséquent, les méthodes sans seuil, telles que la triangulation de Delaunay, ont pris de l'importance ces derniÚres années. De plus, la combinaison d'un ensemble de critÚres, par exemple, les propriétés physico-chimiques, la distance, la géométrie et les angles, a été utilisée pour améliorer la détermination du contact[8].
Nature | CritĂšres de distance maximal |
---|---|
Liaison hydrogĂšne | 3,9 Ă |
Interaction hydrophobe | 5 Ă |
Interaction ionique | 6 Ă |
Empilage aromatique | 6 Ă |
Banque de données sur les protéines (PDB)
La banque de données sur les protéines (PDB) est une base de données de structure 3D pour les grandes molécules biologiques, telles que les protéines, l'ADN et l'ARN. PDB est géré par une organisation internationale appelée Worldwide Protein Data Bank (wwPDB), qui est composée de plusieurs organisations locales, telles que PDBe, PDBj, RCSB et BMRB. Ils sont responsables de la mise à disposition gratuite de copies des données PDB sur Internet. Le nombre structures disponibles au PDB continue d'augmenter chaque année, étant généralement obtenues par cristallographie aux rayons X, spectroscopie RMN ou cryomicroscopie électronique.
Format des données
Le format PDB (.pdb) est l'ancien format de fichier texte utilisé pour stocker les informations des structures tridimensionnelles des macromolécules utilisées par la banque de données sur les protéines.
En raison de restrictions dans la conception de la structure du format, le format PDB ne permet pas de grandes structures contenant plus de 62 chaĂźnes ou 99999 enregistrements d'atomes[10].
Le PDBx/mmCIF (fichier d'informations cristallographiques macromolĂ©culaires) est un format de fichier texte standard pour reprĂ©senter les informations cristallographiques[11]. Depuis 2014, le format PDB a Ă©tĂ© remplacĂ© comme distribution d'archives PDB standard par le format de fichier PDBx/mmCIF (.cif). Alors que le format PDB contient un ensemble d'enregistrements identifiĂ©s par un mot-clĂ© de six caractĂšres maximum, le format PDBx/mmCIF utilise une structure basĂ©e sur la clĂ© et la valeur, oĂč la clĂ© est un nom qui identifie une caractĂ©ristique et la valeur est l'information variable[12].
Autres bases de données structurelles
En plus de la Protein Data Bank (PDB), il existe plusieurs bases de données de structures protéiques et d'autres macromolécules. Les exemples comprennent :
- MMDB : structures tridimensionnelles déterminées expérimentalement de biomolécules issues de la Protein Data Bank (PDB)[13].
- Base de données sur les acides nucléiques (NDB) : informations déterminées expérimentalement sur les acides nucléiques (ADN, ARN)[14].
- Classification structurale des protéines (SCOP) : description complÚte des relations structurelles et évolutives entre des protéines structurellement connues[15].
- TOPOFIT-DB : alignements structuraux de protéines basés sur la méthode TOPOFIT[16].
- Electron Density Server (EDS) : cartes et statistiques de densité électronique sur l'ajustement des structures cristallines et leurs cartes[17].
- CASP : Prediction Center, expérience communautaire et mondiale de prédiction de la structure des protéines CASP[18].
- Serveur PISCES pour la création de listes de protéines non redondantes : génÚre une liste PDB par identité de séquence et critÚres de qualité structurelle[19].
- SBKB (Structural Biology KnowledgeBase) : outils d'aide à la conception de la recherche sur les protéines[20].
- ProtCID (Protein Common Interface Database) : base de données d'interfaces protéine-protéine similaires dans les structures cristallines de protéines homologues[21].
- AlphaFold : base de données sur la structure des protéines[22].
Comparaison de structures
Alignement structurel
L'alignement structurel est une mĂ©thode de comparaison entre des structures 3D en fonction de leur forme et de leur conformation[23]. Il pourrait ĂȘtre utilisĂ© pour dĂ©duire la relation Ă©volutive entre un ensemble de protĂ©ines, mĂȘme avec une faible similitude de sĂ©quence. L'alignement structurel implique la superposition d'une structure 3D sur une seconde, la rotation et la translation des atomes dans des positions correspondantes (en gĂ©nĂ©ral, en utilisant les atomes C α ou mĂȘme les atomes lourds du squelette C, N, O et C α). Habituellement, la qualitĂ© de l'alignement est Ă©valuĂ©e sur la base de l'Ă©cart quadratique moyen (RMSD) des positions atomiques, c'est-Ă -dire la distance moyenne entre les atomes aprĂšs superposition :
oĂč ÎŽ i est la distance entre l'atome i et soit un atome de rĂ©fĂ©rence correspondant dans l'autre structure, soit la coordonnĂ©e moyenne des N atomes Ă©quivalents. En gĂ©nĂ©ral, le rĂ©sultat RMSD est mesurĂ© en unitĂ© Ă ngström (Ă ), ce qui Ă©quivaut Ă 10 â10 m. Plus la valeur RMSD est proche de zĂ©ro, plus les structures sont similaires.
Signatures structurelles basées sur des graphes
Les signatures structurelles, Ă©galement appelĂ©es empreintes digitales, sont des reprĂ©sentations de modĂšles de macromolĂ©cules qui peuvent ĂȘtre utilisĂ©es pour dĂ©duire des similitudes et des diffĂ©rences. Les comparaisons entre un grand nombre de protĂ©ines Ă l'aide de RMSD constituent toujours un dĂ©fi en raison du coĂ»t de calcul Ă©levĂ© des alignements structurels. Des signatures structurelles basĂ©es sur des modĂšles de distance de graphe entre des paires d'atomes ont Ă©tĂ© utilisĂ©es pour dĂ©terminer des vecteurs d'identification de protĂ©ines et pour dĂ©tecter des informations non triviales[24]. De plus, l'algĂšbre linĂ©aire et l'apprentissage automatique peuvent ĂȘtre utilisĂ©s pour regrouper les signatures protĂ©iques, dĂ©tecter les interactions protĂ©ine-ligand, prĂ©dire ÎÎG et proposer des mutations basĂ©es sur la distance euclidienne[25].
Prédiction de structure
Les structures atomiques des molĂ©cules peuvent ĂȘtre obtenues par plusieurs mĂ©thodes, telles que la cristallographie aux rayons X (XRC), la spectroscopie RMN et la microscopie Ă©lectronique 3D ; cependant, ces processus peuvent prĂ©senter des coĂ»ts Ă©levĂ©s et parfois certaines structures peuvent ĂȘtre difficilement Ă©tablies, telles que les protĂ©ines membranaires. Par consĂ©quent, il est nĂ©cessaire d'utiliser des approches informatiques pour dĂ©terminer les structures 3D des macromolĂ©cules. Les mĂ©thodes de prĂ©diction de structure sont classĂ©es en modĂ©lisation comparative et modĂ©lisation de novo.
Modélisation comparative
La modélisation comparative, également appelée modélisation par homologie, correspond à la méthodologie pour construire des structures tridimensionnelles à partir d'une séquence d'acides aminés d'une protéine cible et d'une matrice de structure connue. La littérature a décrit que les protéines liées à l'évolution ont tendance à présenter une structure tridimensionnelle conservée[26]. En outre, des séquences de protéines apparentées distantes dont l'identité est inférieure à 20 % peuvent présenter des replis différents[27].
Modélisation de novo
En bioinformatique structurale, la modélisation ab initio, également connue sous le nom de modélisation ab initio, fait référence à des approches permettant d'obtenir des structures tridimensionnelles à partir de séquences sans la nécessité d'une structure 3D connue homologue. Malgré les nouveaux algorithmes et méthodes proposés ces derniÚres années, la prédiction de la structure des protéines de novo est toujours considérée comme l'un des problÚmes restants en suspens dans la science moderne[28].
Validation des structures
AprÚs la modélisation de la structure, une étape supplémentaire de validation de la structure est nécessaire car de nombreux algorithmes et outils de modélisation comparative et « de novo » utilisent des heuristiques pour essayer d'assembler la structure 3D, ce qui peut générer de nombreuses erreurs. Certaines stratégies de validation consistent à calculer des scores énergétiques et à les comparer à des structures déterminées expérimentalement. Par exemple, le score DOPE est un score énergétique utilisé par l' outil MODELLER pour déterminer le meilleur modÚle[29].
Une autre stratĂ©gie de validation consiste Ă calculer les angles diĂšdres du squelette Ï et Ï de tous les rĂ©sidus et Ă construire un diagramme de Ramachandran. La chaĂźne latĂ©rale des acides aminĂ©s et la nature des interactions dans le squelette restreignent ces deux angles, et ainsi, la visualisation des conformations autorisĂ©es pourrait ĂȘtre effectuĂ©e sur la base du graphique de Ramachandran. Une grande quantitĂ© d'acides aminĂ©s allouĂ©s dans des positions non permissives du graphique est une indication d'une modĂ©lisation de mauvaise qualitĂ©.
Outils de prédiction
Une liste des outils logiciels couramment utilisés pour la prédiction de la structure des protéines, y compris la modélisation comparative, le filetage des protéines, la prédiction de la structure des protéines de novo et la prédiction de la structure secondaire est disponible dans la liste des logiciels de prédiction de la structure des protéines.
Amarrage moléculaire
L'amarrage molĂ©culaire (Ă©galement appelĂ© docking) est une mĂ©thode utilisĂ©e pour prĂ©dire les coordonnĂ©es d'orientation d'une molĂ©cule (ligand) lorsqu'elle est liĂ©e Ă une autre (rĂ©cepteur ou cible). La liaison peut se faire principalement par le biais d'interactions non covalentes, tandis que la liaison liĂ©e de maniĂšre covalente peut Ă©galement ĂȘtre Ă©tudiĂ©e. L'amarrage molĂ©culaire vise Ă prĂ©dire les poses possibles (modes de liaison) du ligand lorsqu'il interagit avec des rĂ©gions spĂ©cifiques du rĂ©cepteur. Les outils d'amarrage utilisent des champs de force pour estimer un score permettant de classer les meilleures poses qui ont favorisĂ© de meilleures interactions entre les deux molĂ©cules.
En gĂ©nĂ©ral, les protocoles d'amarrage sont utilisĂ©s pour prĂ©dire les interactions entre les petites molĂ©cules et les protĂ©ines. Cependant, l'amarrage peut Ă©galement ĂȘtre utilisĂ© pour dĂ©tecter des associations et des modes de liaison entre des protĂ©ines, des peptides, des molĂ©cules d'ADN ou d'ARN, des glucides et d'autres macromolĂ©cules.
DĂ©pistage virtuel
Le criblage virtuel (VS) est une approche informatique utilisée pour le criblage rapide de grandes bibliothÚques de composés pour la découverte de médicaments. Habituellement, le criblage virtuel utilise des algorithmes d'amarrage pour classer les petites molécules ayant la plus haute affinité pour un récepteur cible.
Ces derniers temps, plusieurs outils ont été utilisés pour évaluer l'utilisation du criblage virtuel dans le processus de découverte de nouveaux médicaments. Cependant, des problÚmes tels que des informations manquantes, une compréhension inexacte des propriétés moléculaires de type médicament, des fonctions de notation faibles ou des stratégies d'amarrage insuffisantes entravent le processus d'amarrage. Par conséquent, la littérature a décrit qu'elle n'est toujours pas considérée comme une technologie mature[30] - [31].
Dynamique moléculaire
La dynamique moléculaire est une méthode de calcul pour simuler les interactions entre les molécules et leurs atomes pendant une période de temps donnée[33]. Cette méthode permet l'observation du comportement des molécules et de leurs interactions, en considérant le systÚme dans son ensemble. Pour calculer le comportement des systÚmes et, ainsi, déterminer les trajectoires, la dynamique moléculaire peut utiliser l'équation du mouvement de Newton, en plus d'utiliser des méthodes de mécanique moléculaire pour estimer les forces qui se produisent entre les particules (champs de force)[34].
Applications
Les approches informatiques utilisées en bioinformatique structurale sont :
- SĂ©lection de la cible - Les cibles potentielles sont identifiĂ©es en les comparant avec des bases de donnĂ©es de structures et de sĂ©quences connues. L'importance d'une cible peut ĂȘtre dĂ©cidĂ©e sur la base de la littĂ©rature publiĂ©e. La cible peut Ă©galement ĂȘtre sĂ©lectionnĂ©e sur la base de son domaine protĂ©ique. Les domaines protĂ©iques sont des blocs de construction qui peuvent ĂȘtre rĂ©arrangĂ©s pour former de nouvelles protĂ©ines. Ils peuvent ĂȘtre Ă©tudiĂ©s isolĂ©ment dans un premier temps.
- Suivi des essais de cristallographie aux rayons X - La cristallographie aux rayons X peut ĂȘtre utilisĂ©e pour rĂ©vĂ©ler la structure tridimensionnelle d'une protĂ©ine. Mais, afin d'utiliser les rayons X pour Ă©tudier les cristaux de protĂ©ines, des cristaux de protĂ©ines pures doivent ĂȘtre formĂ©s, ce qui peut prendre de nombreux essais. Cela conduit Ă un besoin de suivre les conditions et les rĂ©sultats des essais. De plus, des algorithmes d'apprentissage automatique supervisĂ© peuvent ĂȘtre utilisĂ©s sur les donnĂ©es stockĂ©es pour identifier les conditions susceptibles d'augmenter le rendement en cristaux purs.
- Analyse des donnĂ©es cristallographiques des rayons X - Le diagramme de diffraction obtenu Ă la suite du bombardement des rayons X sur les Ă©lectrons est la transformĂ©e de Fourier de la distribution de la densitĂ© Ă©lectronique. Il existe un besoin d'algorithmes capables de dĂ©convoluer la transformĂ©e de Fourier avec des informations partielles (en raison d'informations de phase manquantes, car les dĂ©tecteurs ne peuvent mesurer que l'amplitude des rayons X diffractĂ©s, et non les dĂ©phasages). Une technique d'extrapolation telle que la dispersion anormale Ă plusieurs longueurs d'onde peut ĂȘtre utilisĂ©e pour gĂ©nĂ©rer une carte de densitĂ© Ă©lectronique, qui utilise l'emplacement des atomes de sĂ©lĂ©nium comme rĂ©fĂ©rence pour dĂ©terminer le reste de la structure. Le modĂšle boule-et-bĂąton standard est gĂ©nĂ©rĂ© Ă partir de la carte de densitĂ© Ă©lectronique.
- Analyse des données de spectroscopie RMN - Les expériences de spectroscopie par résonance magnétique nucléaire produisent des données bidimensionnelles (ou plus), chaque pic correspondant à un groupe chimique dans l'échantillon. Des méthodes d'optimisation sont utilisées pour convertir les spectres en structures tridimensionnelles.
- CorrĂ©ler les informations structurelles avec les informations fonctionnelles - Les Ă©tudes structurelles peuvent ĂȘtre utilisĂ©es comme sonde pour la relation structurelle-fonctionnelle.
Outils
Logiciel | La description |
---|---|
I-TASSER | Prédiction d'un modÚle de structure tridimensionnelle de molécules de protéines à partir de séquences d'acides aminés. |
MEO | Molecular Operating Environment (MOE) est une plate-forme étendue comprenant la modélisation structurelle des protéines, des familles de protéines et des anticorps[35]. |
SBL | La bibliothÚque de bioinformatique structurale : applications pour utilisateurs finaux et algorithmes avancés |
BALLVoir | Modélisation moléculaire et visualisation[36] |
PIQĂRE | Visualisation et analyse |
PyMOL | Visionneuse et modélisation[37] |
VMD | Visionneuse, dynamique moléculaire[38] |
Roi | Une visionneuse de kinemage Java open source |
FOULĂE | DĂ©termination de la structure secondaire Ă partir des coordonnĂ©es[39] |
MolProbité | Serveur web de validation de structure |
PROCHECK | Un web service de validation de structure |
CheShift | Une application en ligne de validation de la structure des protéines |
3D-mol.js | Un visualiseur moléculaire pour les applications Web développées en Javascript |
PROPKA | Prédiction rapide des valeurs de pKa des protéines sur la base de relations empiriques structure/fonction |
CARA | Affectation de résonance assistée par ordinateur |
Serveur d'accueil | Un serveur web d'amarrage moléculaire |
StarBiochem | Un visualiseur de protéines Java, propose une recherche directe dans la banque de données de protéines |
BĂCHE | L'environnement de dĂ©veloppement d'applications de protĂ©omique structurale |
PocketSuite | Un portail Web pour divers serveurs Web pour l'analyse au niveau du site de liaison. PocketSuite est divisé en : PocketDepth (Prédiction du site de liaison) ; PocketMatch (comparaison des sites de liaison) ; PocketAlign (alignement des sites de liaison) et PocketAnnotate (annotation des sites de liaison). |
MSL | Une bibliothĂšque de logiciels de modĂ©lisation molĂ©culaire C++ open-source pour la mise en Ćuvre de mĂ©thodes d'analyse structurelle, de prĂ©diction et de conception |
PSSpred | Prédiction de la structure secondaire des protéines |
Protée | Outil Web pour suggérer des paires de mutations |
SDM | Un serveur pour prédire les effets des mutations sur la stabilité des protéines |
Bibliographie
- Bourne PE, Gu J (2009). Structural Bioinformatics (2nd ed.). New York: John Wiley & Sons. (ISBN 978-0-470-18105-8)[40].
- Bourne PE, Weissig H (2003). Structural Bioinformatics. Wiley. (ISBN 0-471-20199-5)[41].
- Leach A (2001). Molecular Modelling: Principles and Applications (2nd ed.). Prentice Hall. (ISBN 978-0-582-38210-7)[42].
- Peitsch MC, Schwede T (2008). Computational Structural Biology: Methods and Applications. World Scientific. (ISBN 978-9812778772)[43].
- Leontis NB, Westhof E (April 2001). "Geometric nomenclature and classification of RNA base pairs". RNA. 7 (4): 499â512. doi:10.1017/S1355838201002515. PMC 1370104. PMID 11345429[44].
- Richardson JS (1981). "The anatomy and taxonomy of protein structure". Advances in Protein Chemistry Volume 34. Advances in Protein Chemistry. Vol. 34. p. 167â339. doi:10.1016/S0065-3233(08)60520-3. (ISBN 978-0-12-034234-1). PMID 7020376[45].
- Ramachandran GN, Sasisekharan V (1968). "Conformation of polypeptides and proteins". Advances in Protein Chemistry Volume 23. Advances in Protein Chemistry. Vol. 23. p. 283â438. doi:10.1016/S0065-3233(08)60402-7. (ISBN 978-0-12-034223-5). PMID 4882249[46].
- Ramachandran GN, Ramakrishnan C, Sasisekharan V (July 1963). "Stereochemistry of polypeptide chain configurations". Journal of Molecular Biology. 7: 95â9. doi:10.1016/S0022-2836(63)80023-6. PMID 13990617[47].
Notes et références
Notes
- (en) Cet article est partiellement ou en totalitĂ© issu de lâarticle de WikipĂ©dia en anglais intitulĂ© « Structural bioinformatics » (voir la liste des auteurs).
Références
- Jenny Gu et Philip E. Bourne, Structural Bioinformatics, Hoboken, 2nd, (ISBN 978-1-118-21056-7, OCLC 778339075)
- (en) Jenny Gu et Philip E. Bourne, Structural Bioinformatics, John Wiley & Sons, (ISBN 978-0-470-18105-8, lire en ligne)
- « Comparative visualization of protein secondary structures », BMC Bioinformatics, vol. 18, no Suppl 2,â , p. 23 (PMID 28251875, PMCID 5333176, DOI 10.1186/s12859-016-1449-z)
- « Web3DMol: interactive protein structure visualization based on WebGL », Nucleic Acids Research, vol. 45, no W1,â , W523âW527 (PMID 28482028, PMCID 5570197, DOI 10.1093/nar/gkx383)
- « Protein-peptide interactions », Current Opinion in Structural Biology, vol. 5, no 1,â , p. 103â13 (PMID 7773739, DOI 10.1016/0959-440X(95)80015-S)
- Multifaceted Roles of Crystallography in Modern Drug Discovery, Dordrecht, Springer, coll. « NATO Science for Peace and Security Series A: Chemistry and Biology », , 83â92 p. (ISBN 978-3-642-17906-8, DOI 10.1007/978-3-642-17907-5_4), « Protein-ligand interactions as the basis for drug action. »
- « Proteus | PROTein Engineering Supporter | », proteus.dcc.ufmg.br (consulté le )
- Pedro M. Martins, VinĂcius D. Mayrink, Sabrina de A. Silveira et Carlos H. da Silveira, « How to compute protein residue contacts more accurately? », Proceedings of the 33rd Annual ACM Symposium on Applied Computing, ACM,â , p. 60â67 (ISBN 978-1-4503-5191-1, DOI 10.1145/3167132.3167136, lire en ligne)
- « Protein cutoff scanning: A comparative analysis of cutoff dependent and cutoff free methods for prospecting contacts in proteins », Proteins, vol. 74, no 3,â , p. 727â43 (PMID 18704933, DOI 10.1002/prot.22187, S2CID 1208256, lire en ligne)
- « PDBx/mmCIF General FAQ », mmcif.wwpdb.org (consulté le )
- (en) wwPDB.org, « wwPDB: File Formats and the PDB », www.wwpdb.org (consulté le )
- « PDBx/mmCIF Dictionary Resources », mmcif.wwpdb.org (consulté le )
- « Macromolecular Structures Resource Group », www.ncbi.nlm.nih.gov (consulté le )
- « Nucleic Acid Database (NDB) », ndbserver.rutgers.edu (consulté le )
- « SCOP: Structural Classification of Proteins » [archive du ], (consulté le )
- « Structural alignment of proteins by a novel TOPOFIT method, as a superimposition of common volumes at a topomax point », Protein Science, vol. 13, no 7,â , p. 1865â74 (PMID 15215530, PMCID 2279929, DOI 10.1110/ps.04672604)
- « EDS - Uppsala Electron Density Server », eds.bmc.uu.se (consulté le )
- « Home - Prediction Center », www.predictioncenter.org (consulté le )
- « :: Dunbrack Lab », dunbrack.fccc.edu (consulté le )
- « Structural Biology KnowlegebaseSBKB - SBKB », sbkb.org (consulté le )
- « Protein Common Interface Database », dunbrack2.fccc.edu (consulté le )
- « AlphaFold »
- « Structural alignment (genomics) », ScienceDaily (consulté le )
- « Cutoff Scanning Matrix (CSM): structural classification and function prediction by protein inter-residue distance patterns », BMC Genomics, vol. 12 Suppl 4, no S4,â , S12 (PMID 22369665, PMCID 3287581, DOI 10.1186/1471-2164-12-S4-S12)
- « A Computational Method to Propose Mutations in Enzymes Based on Structural Signature Variation (SSV) », International Journal of Molecular Sciences, vol. 20, no 2,â , p. 333 (PMID 30650542, PMCID 6359350, DOI 10.3390/ijms20020333)
- (en) Kaczanowski et Zielenkiewicz, « Why similar protein sequences encode similar three-dimensional structures? », Theoretical Chemistry Accounts, vol. 125, nos 3â6,â , p. 643â650 (ISSN 1432-881X, DOI 10.1007/s00214-009-0656-3, S2CID 95593331, lire en ligne)
- « The relation between the divergence of sequence and structure in proteins », The EMBO Journal, vol. 5, no 4,â , p. 823â6 (PMID 3709526, PMCID 1166865, DOI 10.1002/j.1460-2075.1986.tb04288.x)
- « So much more to know », Science, vol. 309, no 5731,â , p. 78â102 (PMID 15994524, DOI 10.1126/science.309.5731.78b)
- « Comparative Protein Structure Modeling Using MODELLER », Current Protocols in Bioinformatics, vol. 47, no 1,â , p. 5.6.1â32 (PMID 25199792, PMCID 4186674, DOI 10.1002/0471250953.bi0506s47)
- Anupam Dhasmana, Sana Raza, Roshan Jahan, Mohtashim Lohani et Arif, New Look to Phytomedicine, Academic Press, , 523â548 p. (ISBN 978-0-12-814619-4, DOI 10.1016/b978-0-12-814619-4.00020-3, S2CID 69534557), « Chapter 19 - High-Throughput Virtual Screening (HTVS) of Natural Compounds and Exploration of Their Biomolecular Mechanisms: An In Silico Approach »
- The practice of Medicinal Chemistry, Academic Press, , 73â99 p. (ISBN 978-0-12-417205-0, DOI 10.1016/B978-0-12-417205-0.00004-3), « Strategies in the search for new lead compounds or original working hypotheses. »
- « Molecular Dynamics Gives New Insights into the Glucose Tolerance and Inhibition Mechanisms on ÎČ-Glucosidases », Molecules, vol. 24, no 18,â , p. 3215 (PMID 31487855, PMCID 6766793, DOI 10.3390/molecules24183215)
- (en) « Studies in Molecular Dynamics. I. General Method », The Journal of Chemical Physics, vol. 31, no 2,â , p. 459â466 (ISSN 0021-9606, DOI 10.1063/1.1730376, Bibcode 1959JChPh..31..459A)
- Yousif, « Exploring the Molecular Interactions between Neoculin and the Human Sweet Taste Receptors through Computational Approaches », Sains Malaysiana, vol. 49, no 3,â , p. 517â525 (DOI 10.17576/jsm-2020-4903-06, lire en ligne)
- MOE
- BALLView
- PyMOL
- VMD
- STRIDE
- Jenny Gu et Philip E. Bourne, Structural bioinformatics, Wiley-Blackwell, (ISBN 978-1-61344-614-0 et 1-61344-614-4, OCLC 799881918, lire en ligne)
- Philip E. Bourne et Helge Weissig, Structural bioinformatics, Wiley-Liss, (ISBN 0-471-20200-2, 978-0-471-20200-4 et 0-471-20199-5, OCLC 50199108, lire en ligne)
- Andrew R. Leach, Molecular modelling : principles and applications, Prentice Hall, (ISBN 0-582-38210-6 et 978-0-582-38210-7, OCLC 45008511, lire en ligne)
- Torsten Schwede et Manuel C. Peitsch, Computational structural biology : methods and applications, World Scientific, (ISBN 981-277-878-0 et 978-981-277-878-9, OCLC 316004177, lire en ligne)
- NEOCLES B. LEONTIS et ERIC WESTHOF, « Geometric nomenclature and classification of RNA base pairs », RNA, vol. 7, no 4,â , p. 499â512 (ISSN 1355-8382, DOI 10.1017/s1355838201002515, lire en ligne, consultĂ© le )
- Christian B. Anfinsen, John T. Edsall et Frederic M. Richards, Advances in protein chemistry. Volume 34, Academic Press, (ISBN 978-0-08-058207-8, 0-08-058207-9 et 0-12-034234-0, OCLC 373466726, lire en ligne)
- Christian B. Anfinsen, Advances in protein chemistry. Volume 23, Academic Press, (ISBN 978-0-12-034223-5, 0-12-034223-5 et 978-0-08-058196-5, OCLC 646758501, lire en ligne)
- G. N. Ramachandran, C. Ramakrishnan et V. Sasisekharan, « Stereochemistry of polypeptide chain configurations », Journal of Molecular Biology, vol. 7,â , p. 95â99 (ISSN 0022-2836, PMID 13990617, DOI 10.1016/s0022-2836(63)80023-6, lire en ligne, consultĂ© le )
Voir aussi
- MMDB
- Protein Data Bank
- Structural Classification of Proteins database
- STING
- Molecular modelling
- List of software for molecular mechanics modeling
- Molecular Conceptor
- Protein structure prediction
- CASP