단백질 구조 예측 방법 및 소프트웨어에 대한 안내서

그들의 생물학적 기능을 발휘하기 위해, 단백질은 복잡하고 가역적 인 비공유 상호 작용에 의해 지시되는 하나 이상의 특정 형태로 접 힙니다. 단백질의 구조를 결정하는 것은 결정학, 핵 자기 공명 분광법 및 이중 분극 간섭 법과 같은 시간 소모적이고 비교적 비싼 기술에 의해 달성 될 수있다. Bioinformatics 소프트웨어는 아미노산 서열을 기반으로 단백질 구조를 계산하고 예측하기 위해 개발되었습니다.

단백질 구조에 대한 요약

실험 기술에 대한 대안으로, 구조 분석 및 예측 도구는 아미노산 서열에 따라 단백질 구조를 예측하는 데 도움이됩니다. 주어진 단백질의 구조를 해결하는 것은 의약 (예 : 약물 디자인)과 생명 공학 (예 : 새로운 효소 디자인)에 매우 중요합니다. 계산 단백질 예측의 분야는 따라서 기계의 계산 능력의 증가와 지능형 알고리즘의 개발에 따라 끊임없이 진화하고 있습니다.

단백질 구조에는 4 가지 수준이 있습니다 (그림 1). 단백질 구조 예측에서 1 차 구조는 2 차 및 3 차 구조를 예측하는 데 사용됩니다.

단백질의 이차 구조는 수소 결합에 의해 안정화되는 폴리 펩타이드 쇄 내에서 국소 적으로 폴딩된다. 가장 일반적인 이차 단백질 구조는 알파 나선 및 베타 시트입니다.

다른 2 차 구조가 모두 3D 구조로 접 히면 3 차 구조는 단백질의 최종 형태입니다. 이 최종 형태는 이온 상호 작용, 이황화 교량 및 반 데 발스 힘을 통해 형성되고 함께 유지됩니다.

4 가지 수준의 단백질 구조. Khanacademy.org의 이미지.

단백질 구조 예측 방법 및 소프트웨어

장애 예측, 역학 예측, 구조 보존 예측 등과 같은 전용 단백질 기능 및 특수성을 위해 수많은 구조 예측 소프트웨어가 개발되었습니다. 접근에는 상 동성 모델링, 단백질 스레딩, ab initio 방법, 2 차 구조 예측 및 막 횡단 나선이 포함됩니다. 신호 펩티드 예측.

올바른 방법을 선택하는 것은 항상 알려지지 않은 단백질의 1 차 서열을 사용하고 단백질 데이터베이스에서 동종 체를 검색하는 것으로 시작합니다 (그림 2).

단백질 구조 예측 방법에 대한 의사 결정 차트.

단백질 구조 예측에 대한 자세한 방법은 다음과 같습니다.

  • 이차 구조 예측 도구

이러한 도구는 단백질의 아미노산 서열에만 근거하여 국소 2 차 구조를 예측합니다. 예측 된 구조는 DSSP 점수와 비교되며, 이는 단백질의 결정 학적 구조에 기초하여 계산됩니다 (여기서는 DSSP 점수에 대한 자세한 내용 참조).

이차 구조에 대한 예측 방법은 주로 알려진 단백질 구조의 데이터베이스 및 신경망 및 서포트 벡터 기계와 같은 최신 기계 학습 방법에 의존합니다.

다음은 2 차 구조 예측을위한 훌륭한 도구입니다.

  • 3 차 구조

3 차 (또는 3 차원) 구조 예측 도구는 Ab initio와 비교 단백질 모델링의 두 가지 주요 방법으로 분류됩니다.

Ab initio (또는 de novo) 단백질 구조 예측 방법은 명백한 주형을 사용하지 않고 단백질 폴딩 에너지 및 / 또는 고유 구조가 획득하는 구조적 특징의 통계적 경향을 지배하는 일반적인 원리에 기초하여 서열로부터 3 차 구조를 예측하려고 시도한다.

단백질의 3 차 구조에 대한 모든 정보는 1 차 구조 (즉, 아미노산 서열)로 인코딩됩니다. 그러나, 이들 중 다수가 예측 될 수 있으며, 그 중 하나만이 적절히 접히는 데 필요한 최소 자유 에너지 및 안정성을 갖는다. Ab initio 단백질 구조 예측은 따라서 단백질의 고유 형태를 해결하기 위해 방대한 양의 계산 능력과 시간을 필요로하며, 현대 과학의 주요 과제 중 하나입니다.

가장 많이 사용되는 서버에는 로베타 (로제타 소프트웨어 패키지 사용), SWISS-MODEL, PEPstr, QUARK가 있습니다. 전체 목록을 여기에서 찾아보십시오.

공지 된 3 차 구조의 단백질이 결정되지 않은 구조의 잠재적 상 동체와 서열의 적어도 30 %를 공유하는 경우, 추정 된 미지의 구조를 공지와 중첩시키는 비교 방법을 사용하여 미지의 가능성있는 구조를 예측할 수있다. 상 동성 모델링 및 단백질 스레딩은 다른 유사한 단백질에 대한 사전 정보를 사용하여 서열에 따라 미지의 단백질의 예측을 제안하는 두 가지 주요 전략입니다.

상 동성 모델링 및 단백질 스레딩 소프트웨어에는 RaptorX, FoldX, HHpred, I-TASSER 등이 포함됩니다.

참고 문헌

드 노보 단백질 구조 예측. 위키 백과.

단백질 구조 예측. 위키 백과