인간 게놈 프로젝트의 핵심으로 거대한 문제가있다.

$config[ads_kvadrat] not found

[오픈인터뷰]'가상화 스토리지'(IP SAN)에 관한 5가지 궁금증

[오픈인터뷰]'가상화 스토리지'(IP SAN)에 관한 5가지 궁금증

차례:

Anonim

1990 년대에 시작된 인간 게놈 프로젝트 (Human Genome Project)는 호모 사피엔스 '우리 종의 DNA 전체를지도로 작성하려는 성공적인 시도. 그것은 세계의 유전학 연구 및 유전학 테스트 서비스에 결정적인 인간 DNA의 정교하고 세련된 컬렉션 인 인간 참조 게놈을 생산했습니다. 존스 홉킨스 대학 (Johns Hopkins University)의 두 연구자는 과학 공동체에있어 필수적인 것으로, 참고 게놈에는 정확히 296,485,284 쌍의 DNA가 빠져 있다는 사실이 발견되었습니다.

참조 게놈은 비교를위한 기초로 사용되는 인간 유전 물질의 필수지도입니다. 우리가 건강, 가족력 및 미래의 질병 위험에 대한 통찰력을 얻기 위해 우리 자신의 DNA를 시퀀싱 할 때, 우리는 그 시퀀스를 많은 작은 조각으로 잘라 내고 참조 게놈과 비교하여 우리가 다른 영역을 찾는다. 이 근본적인 문제는 과학자들이 최근의 논문에서 자연 유전학, 참조 게놈은 주로 한 사람에 근거한다는 것입니다. 오늘날 살아있는 77 억 인구 중 무수한 유전 적 차이를 고려할 때, 그것은 분명히 이상적이지 않습니다.

컴퓨터 과학 및 생물 통계학 교수 Steven Salzberg, Ph.D., Rachel Sherman, Ph.D. 후보자는이 단일 참조 게놈이 인간 유전학의 다양성을 포착하지 않는다는 사실을 확인하십시오. 일부 인구는 차이가 있습니다. 너무 많은 이 참조 게놈에서 그들의 사례를 만들기 위해 그들은 20 개국의 910 명의 개인, 모든 범 아프리카 계통의 유전체를 언급합니다.

이 개인들의 DNA에서 연구진은 우리의 "참조"게놈에 존재하지 않는 3 억 개의 DNA 공통편을 발견했다. Salzberg는 이처럼 많은 자료를 무시하면 필연적으로 특정 인구의 건강과 역사에 대한 핵심 통찰력을 놓치게됩니다. 그것들 역시 인간이므로, "인간"참조 게놈에서 표현되어서는 안된다.

Salzberg는 "이 지역들은 유전체 공동체가 본질적으로 볼 때 유전체가 존재할 때까지는 볼 수 없다" 역.

Reference Genome의 문제점.

수년 동안, 우리는 계속해서 참조 게놈을 작업했습니다. 그러나 최근의 분석에 따르면 칠십 퍼센트 의 자료는 RPCI-11로만 불리는 아프리카 계 미국인 한 명에게서 수집되었다고 잘츠부르크는 설명했다.

즉, 과학자들이 전 세계의 다양한 개체군 간의 차이를 확인하기 위해 유전자 분석을 수행 할 때, 대부분의 경우 유전체를 대개 한 사람의 유전 물질과 비교합니다. Sherman은 이렇게 말하면서 우리는이 참조와 너무 다른 내용을 종종 무시하게됩니다. 그녀는 그들을 "실종 된 조각"이라고 부른다.

"당신이 일렬로 세울 때, 참조 게놈으로부터의 어떤 것과도 일치하기에는 너무 다른 조각들이 있기 때문에 정렬되지 않는 조각들이있을 것입니다."셔먼은 말한다. "그런 다음 실제로 관련성이 없거나 실제로 가치가없는 것으로 정렬되지 않은 모든 것을 무시합니다. 아마도 이것이 참조 게놈과 가장 다르기 때문에 가장 흥미로운 부분 일 것입니다."

이 연구에서 Sherman과 Salzberg는이 "다른"물질 (약 1,000 개의 염기쌍)의 큰 덩어리를 가져 와서 우연한 연속 염기 서열을 나타내는지를 결정하려고했거나 실제로 탐구되지 않은 인간 DNA에 대한 유용한 정보를 보유하고있었습니다.

연구팀은이 "새로운"DNA가 인체에 대한 중요성이 아직 알려지지 않았음에도 불구하고 두 번째 패스를 보증 할만큼 충분히 높은 품질의 DNA라는 결론에 도달했습니다.

그 결과는 무엇인가?

지금까지 Sherman은 참조 게놈에서 표시되지 않은 DNA를 무시함으로써 우리가 누락 된 것을 실제로 알 수는 없다고 말했습니다. 그러나 우리가 살펴 본다면 우리가 그곳에서 무엇을 찾을 수 있는지 누가 알 수 있습니까?

Salzberg는 우리가 여분의 염색체를 가진 가상의 개체를 상상해 보라고 제안합니다 - 각 세포에 보통 23 개가 아닌 24 개. 이 개체군의 여분의 염색체 중 어느 것도 참조 게놈과 일치하지 않습니다. 그 숨겨진 염색체의 어딘가에서 허구의 개체군이 특정 질병을 앓는 경향이있는 이유는 무엇일까? 그리고 나머지 세계는 왜 그렇지 않은 것일까. 그러나 우리는 그것을 비교할 올바른 기준이 없기 때문에 거기에 있다는 것을 결코 알 수 없습니다.

인간 게놈 프로젝트 (Buffalo News, 3/23/1997), h / t Pieter de Jong (pic.twitter.com/gNB7mMv3Yu)에 기증자를 데려온 원본 광고

- Jay Shendure (@JShendure) 2017 년 10 월 28 일

"한동안 문제를 일으킨 염색체에 돌연변이가있는 경우, 그 돌연변이를 연구 할 수 없었습니다."라고 Salzberg는 말합니다. "이 참조 게놈에 독점적으로 의존한다면 당신은 그들을 관찰 할 수 없을 것입니다."

이 연구는 알려지지 않은 일부 염색체에 대한 증거를 제공하지 않습니다. 그러나 우리 종 전체의 DNA에 대한 우리의 모든 분석을위한 기초로서 RPCI-11이라는 어떤 사람으로부터 하나의 참조 게놈을 사용할 때 우리는 아마도 많은 것을 잃어 버렸을 것입니다.

어떻게 고칠 수 있습니까?

팀은 하나의 보편적 인 참조 게놈을 찾기 위해 노력하는 대신, 우리는 다발 의 참조 게놈 - 아마도 관심있는 각 인구에 대한 하나.

"이 발견으로 우리가 여기에서 옹호하는 것은 우리가 각 개체군에 대한 참조 게놈을 실제로 만들어야한다는 것입니다."라고 Sherman은 말합니다. "이 인구 집단에서 이처럼 많은 유전자가 결핍 된 경우 모델을 바꿀 필요가 있습니다."

일부 국가에서는 적어도 자신의 참조 게놈을 만들려고 노력했습니다. 예를 들어 덴마크는 진정한 "덴마크"참조 게놈을 만들기 위해 150 Danes의 유전 물질을 수집하고있다. 2016 년 신문 자연 이 논문은 한사람을 대상으로 한 연구만을 기술하고 있지만 한국인을위한 참고 문헌을 작성하려는 시도를 기술하고있다. 그러나 1,000 Genomes Project와 같은 다른 프로젝트에서도이 프로세스를 시작하려고하고 있지만 현재 버전 인 GRCh38으로 연마 된 참조 자료를 만드는 것은 많은 작업입니다.

"참조 게놈을 만들기 위해 다른 사람들과 다른 사람을 서열 짓는 것 이상을해야한다"고 그는 덧붙였다. "너는 좀 더해야 해."

연구원들이 더 많은 참조 게놈이 필요하다는 것을 인식하지 못했습니다. Salzberg는 지금까지 그들 중 더 많은 것이있을 것으로 기대하고 있으며 표준 참조 게놈 으로서는 적어도 널리 채택 될 것이라고 생각합니다. 이 시도 중 어느 것도 GRCh38과 동일한 지위와 영향력을 얻지는 못했지만 덴마크 프로젝트의 목표입니다.

앞으로 Sherman과 Salzberg는 1 ~ 2 년 내에 석방하기를 희망하는 몇 가지 추가 기준 게놈을 구축하여이 프로젝트를 시작하기 위해 자체적으로이 프로젝트를 진행하고 있습니다. 연구진은 참조 게놈의 라이브러리를 만들기 시작했다.이 게놈은 어떻게 다른가에 상관없이 유전 물질에 대한 많은 통찰력을 얻을 수 있도록 돕고있다.

"우리가 정말로 가지고 있어야하는 것은 수백 개의 참조 게놈입니다."라고 그는 덧붙입니다. "언젠가는 그렇게 될 것입니다."

$config[ads_kvadrat] not found