COGcollator 2.0:

инструмент для анализа родственных связей между семействами гомологичных белков
Для цитирования: Dibrova D.V., Konovalov K.A., Perekhvatov V.V., Skulachev K.V., Mulkidjanian A.Y. (2017) COGcollator: A web service for analysis of distant relationships between homologous protein families. Biology Direct 12(29). [DOI: 10.1186/s13062-017-0198-x]
База данных
Доступные базы данных:
  • COG2020 — наша последняя версия базы данных профилей HMM для версии базы данных КОГов, выпущенной в 2020 г. (март 2024, 4870 доменов)
  • Pfam — релиз Pfam 36.0 (июль 2023, 20795 доменов)
ID
Введите идентификатор домена, соответствующий выбранной базе данных. Для базы данных Pfam можно использовать как обычный идентификатор (например, PF00001), так и уникальное короткое имя (например, 7tm_1).
Порог E-value:
Порог величины e-value: находки с таким и меньшим e-value будут показаны на графике. E-value для находок выбранного профиля вычисляется программой hmmsearch для всей последовательности (то есть белки, содержащие дупликацию целевого домена, будут иметь намного более высокий вес и низкое E-value). Находки брались из прокариотической базы данных, основанной на наборе 1309 геномов, белки которых были ранее отнесены к КОГам (Galperin et al., 2021), и эукариотической базы данных белков из 102 видов, отобранных нами вручную. Для анализа доменов Pfam число анализируемых геномов позвоночных и насекомых было сокращено, и поиск осуществлялся по базе данных протеомов 61 эукариота.
Фильтр:
Если выбрать «Да», то в находках будут показаны только те КОГи, которые по указанным в базе данных КОГов координатам пересекаются с находкой профиля HMM выбранного домена хотя бы на 5 а.о. Таким образом будут скрыты КОГи, которые попадали на график не из-за возможного родства с выбранным доменом, а из-за наличия сшивок с ним или с родственными доменами. Белки, для которых в ходе такой процедуры были скрыты все КОГи, буду показаны как не содержащие КОГов (маленькими черными точками).