Nous avons mis en œuvre notre algorithme comme un serveur Web de prédiction de contact entièrement automatisé (http://raptorx.uchicago.edu/ContactMap/) et en septembre 2016 a commencé à le tester aveuglément par le biais de la référence hebdomadaire Live CAMEO (http://www.cameo3d.org/). CAMEO est exploité par le groupe Schwede, avec qui nous n`avons jamais collaboré. CAMEO peut être interprété comme un CASP entièrement automatisé, mais a un plus petit nombre (~ 30) de serveurs participants puisque de nombreux serveurs participant au CASP ne sont pas entièrement automatisés et, par conséquent, ne peuvent pas gérer le grand nombre de cibles de test utilisées par CAMEO. Néanmoins, les participants à la CAMÉE comprennent des serveurs bien connus tels que Robetta [35], phyre [36], RaptorX [37], Swiss-model [38] et HHpred [39]. Pendant ce temps, Robetta emploie à la fois ab initio pliage et modèle basé modélisation tandis que les quatre derniers emploient principalement modèle basé modélisation. Chaque week-end CAMEO envoie des séquences de test aux serveurs participants pour la prédiction, puis évalue les modèles 3D collectés à partir des serveurs. Les protéines de test utilisées par CAMEO n`ont pas de structures natives accessibles au public jusqu`à ce que CAMEO termine la collecte des modèles des serveurs participants. Référence: Wang S, Sun S, Li Z, Zhang R, Xu J (2017) prédiction précise de Novo de la carte de contact de protéine par le modèle d`apprentissage ultra-profond. PLoS comput Biol 13 (1): e1005324. https://doi.org/10.1371/journal.pcbi.1005324 David Smith et lang Moore, «le modèle SIR pour la propagation de la maladie-le numéro de contact», convergence (décembre 2004).

Pour comparer la qualité de nos modèles assistés par contact et modèles basés sur modèle (TBMs), nous avons construit des TBMs pour toutes les protéines de test en utilisant nos protéines d`entraînement comme modèles candidats. Pour générer des TBMs pour une protéine de test, nous avons d`abord exécuter HHblits (avec la bibliothèque UniProt20_2016) pour générer un fichier HMM pour la protéine de test, puis exécutez HHsearch avec ce fichier HMM pour rechercher les meilleurs modèles parmi les protéines de formation 6767, et enfin exécuter MODELLER à construire un TBM à partir de chacun des 5 principaux modèles. La figure 4 montre la comparaison tête à tête entre nos 1 premiers modèles assistés par contact et le Top 1 TBMs sur ces trois séries d`essais en termes de TMscore et de lDDT. Le lDDT moyen de nos 1 premiers modèles assistés par contact est de 45,7 tandis que celui du Top 1 TBMs est seulement 20,7. Lorsque seuls les premiers modèles sont évalués, nos modèles assistés par contact pour les protéines de test 76 CAMEO ont un TMscore moyen 0,407 tandis que les TBMs ont un TMscore moyen 0,317. Sur les protéines de test CASP11 105, le TMscore moyen de nos modèles assistés par contact est 0,518 tandis que celui du TBMs est seulement 0,393. Sur les protéines membranaires 398, le TMscore moyen de nos modèles assistés par contact est 0,493 tandis que celui du TBMs est seulement 0,149. La même tendance est observée lorsque les 5 premiers modèles sont comparés (S2 fig). Le lDDT moyen de nos 5 principaux modèles assistés par contact est de 46,4, tandis que celui du Top 5 TBMs est seulement 24,0.