Bioinformatics[1]

생물 정보학은 생물학적인 문제를 응용수학, 정보학, 통계학, 전산학, 인공지능, 화학, 생화학등을 이용하여 주로 분자 수준에서 다루는 학문이다. 주 연구분야는 서열정렬, 유전자 검색, 유전자 어셈블, 단백질 구조 정렬, 단백질 구조 예측, 유전자발현의 예측, 단백질간 상호작용, 진화모델 등 다양하다.

1. 발생 배경

DNA 서열 분석 방법의 발달에 따라 현재 수많은 종의 게놈 서열이 밝혀져 있으며, 이로부터 만들어지는 RNA와 단백질에 대한 서열의 정보 또한 급속히 증가하고 있다. 또한, 특정 조건에서의 유전자들의 발현량, 그들의 산물 및 상호작용들에 대한 정보가 transcriptomics, proteomics, metabolomics와 같은 방법들을 이용하여 대규모로 얻어지고 있다. 이와 같이 데이터의 양이 급격히 증가함에 따라 이를 수작업으로 다룬다는 것은 불가능하게 되었으며, 이로부터 유용한 지식을 얻어내기 위해서는 수학, 통계학, 전산학을 기반으로 하는 방법론들이 필요로 하게 되었다. 이처럼 생물체로부터 얻어진 대량의 데이터로부터 유용한 지식을 얻어내기 위한 전산/통계/수학적인 도구를 통칭하는 용어로써 생물정보학(bioinformatics)이 쓰이고 있으며, 전산생물학(computational biology)이라는 용어 또한 흔히 같은 뜻으로 쓰이고 있다. 이처럼 생물체로부터 얻어진 대량의 데이터로부터 유용한 지식을 얻어내고자 하는 노력 중에서, 시스템 전체에 대한 분석 및 수리적인 모델링(mathematical modeling)을 강조하는 용어인 시스템 생물학(systems biology)도 생물정보학과 상당부분 겹치는 용어이다.

2. 관련 분야

* 생물학
* 전산학
: 대용량의 데이터 처리 및 가공, 변형에 전산학이 필수적으로 필요하다.
* 통계학: 방대한 자료에서 의미있는 정보를 얻어낼 때 주로 통계적 처리가 필요하다.
* 수학: 생물학적 자료의 방대함으로 인해, 현재의 컴퓨터 계산 능력(computing power)으로도 적당한 시간 안에 자료를 처리할 수 없는 경우, 또는, 새로운 방법으로 자료를 해석해야 하는 경우, 수학적인 방법론이 필요하다.

3. 하위 분야

* 유전체학
   * 개인유전체학
   * 기능 유전체학
   * 비교 유전체학
* 변이체학
* 단백체학
* 상호작용체학

[1] From Wikipedia, http://ko.wikipedia.org/wiki/생물정보학