COGcollator 2.0:

инструмент для анализа родственных связей между семействами гомологичных белков
Для цитирования: Dibrova D.V., Rykov S.Y. (2024) COGcollator 2.0: an improved web server for analysis of distant relationships between homologous protein families. Bioinformatics of Genome Regulation and Structure/Systems Biology (BGRS/SB-2024), Fourteenth International Multiconference. Abstracts. August 5–10, 2024, Novosibirsk, Russia: P. 60–62. [DOI: 10.18699/bgrs2024-1.1-16]
База данных
Доступные базы данных:
  • COG2020 — наша последняя версия базы данных профилей HMM для версии базы данных КОГов, выпущенной в 2020 г. (март 2024, 4870 доменов)
  • Pfam — релиз Pfam 36.0 (июль 2023, 20795 доменов)
ID
Введите идентификатор домена, соответствующий выбранной базе данных. Для базы данных Pfam можно использовать как обычный идентификатор (например, PF00001), так и уникальное короткое имя (например, 7tm_1).
Порог E-value:
Порог величины e-value: находки с таким и меньшим e-value будут показаны на графике. E-value для находок выбранного профиля вычисляется программой hmmsearch для всей последовательности (то есть белки, содержащие дупликацию целевого домена, будут иметь намного более высокий вес и низкое E-value). Находки брались из прокариотической базы данных, основанной на наборе 1309 геномов, белки которых были ранее отнесены к КОГам (Galperin et al., 2021), и эукариотической базы данных белков из 102 видов, отобранных нами вручную. Для анализа доменов Pfam число анализируемых геномов позвоночных и насекомых было сокращено, и поиск осуществлялся по базе данных протеомов 61 эукариота.
Фильтр:
Если выбрать «Да», то в находках будут показаны только те КОГи, которые по указанным в базе данных КОГов координатам пересекаются с находкой профиля HMM выбранного домена хотя бы на 5 а.о. Таким образом будут скрыты КОГи, которые попадали на график не из-за возможного родства с выбранным доменом, а из-за наличия сшивок с ним или с родственными доменами. Белки, для которых в ходе такой процедуры были скрыты все КОГи, буду показаны как не содержащие КОГов (маленькими черными точками).