동영상과 함께 설명해주는 실험방법... http://www.jove.com
요즘 좋은거 많이 나온다.ㅋㅋ

아래는 고인골에서 추출한 DNA에서 서열확인을 위해서, 원하는 DNA를 선택적으로 분리하는 실험방법에 대한 설명

* Link : http://www.jove.com/index/details.stp?id=1573

* ABSTRACT : We present a method of targeted DNA sequence retrieval from DNA sources which are heavily degraded and contaminated with microbial DNA, as is typical of ancient bones. The method greatly reduces sample destruction and sequencing demands relative to direct PCR or shotgun sequencing approaches. We used this method to reconstruct the complete mitochondrial DNA (mtDNA) genomes of five Neandertals from across their geographic range. The mtDNA genetic diversity of the late Neandertals was approximately three times lower than that of contemporary modern humans. Together with analyses of mtDNA protein evolution, these data suggest that the long-term effective population size of Neandertals was smaller than that of modern humans and extant great apes.


Posted by 토리군
Population Genetics statistical program
Arlequin 3.11 (download) & manual download

Homepage =>> http://cmpg.unibe.ch/software/arlequin3


<가능한 분석>
  The analyses Arlequin can perform on the data fall into two main categories: intra-population and inter-population methods. In the first category statistical information is extracted independently from each population, whereas in the second category, samples are compared to each other.

Intra-population methods:

Short description:

Standard indices

Some diversity measures like the number of polymorphic sites, gene diversity.

Molecular diversity

Calculates several diversity indices like nucleotide diversity, different estimators of the population parameter q.

Mismatch distribution

The distribution of the number of pairwise differences between haplotypes, from which parameters of a demographic (NEW in ver 3.x) or spatial population expansion can be estimated

Haplotype frequency estimation

Estimates the frequency of haplotypes present in the population by maximum likelihood methods.

Gametic phase estimation
(NEW in ver 3.x)

Estimates the most like gametic phase of multi-locus genotypes using a pseudo-Bayesian approach (ELB algorithm).

Linkage disequilibrium

Test of non-random association of alleles at different loci.

Hardy-Weinberg equilibrium

Test of non-random association of alleles within diploid individuals.

Tajima’s neutrality test

Test of the selective neutrality of a random sample of DNA sequences or RFLP haplotypes under the infinite site model.

Fu's FS neutrality test

Test of the selective neutrality of a random sample of DNA sequences or RFLP haplotypes under the infinite site model.

Ewens-Watterson neutrality test

Tests of selective neutrality based on Ewens sampling theory under the infinite alleles model.

Chakraborty’s amalgamation test

A test of selective neutrality and population homogeneity. This test can be used when sample heterogeneity is suspected.

Minimum Spanning Network (MSN)

Computes a Minimum Spanning Tree (MST) and Network (MSN) among haplotypes. This tree can also be computed for all the haplotypes found in different populations if activated under the AMOVA section.

   

Inter-population methods:

Short description:

Search for shared haplotypes between populations

Comparison of population samples for their haplotypic content. All the results are then summarized in a table.

AMOVA

Different hierarchical Analyses of Molecular Variance to evaluate the amount of population genetic structure.

Pairwise genetic distances

FST based genetic distances for short divergence time.

Exact test of population differentiation

Test of non-random distribution of haplotypes into population samples under the hypothesis of panmixia.

Assignment test of genotypes

Assignment of individual genotypes to particular populations according to estimated allele frequencies.

   

Mantel test:

Short description:

Correlations or partial correlations between a set of 2 or 3 matrices

Can be used to test for the presence of isolation-by-distance

   

<ScreenShots>
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

Posted by 토리군
이 프로그램은 사용이 쉬운 편이다.

여기서는 STR 분석을 예로 설명해 보았다.

먼저 분석된 데이터를 엑셀에서 아래와 같은 양식으로 데이타를 정리한다.
사용자 삽입 이미지
* 두 allele을 따로따로 입력했을 경우,
CONCATENATE 함수를 이용하면 쉽게 두 문자를 합쳐서 위 양식을 만들 수 있다.
(각 marker의 두 allele은 / 으로 구분한다.)

위 양식을 복사해서 txt 파일을 만든다.
사용자 삽입 이미지
제일 윗줄에는 marker 이름, 아래에는 각 marker의 allele을 적는다. marker 사이는 tab으로 띄워준다.
(엑셀에서 복사하면 tab으로 띄워져 있으니 그냥 두면 된다.)

Powermarker를 실행한다.
사용자 삽입 이미지
Project가 없을경우, Project를 생성한다. 명칭은 원하는대로...

그리고 Dataset을 클릭한다.
사용자 삽입 이미지
Browse를 클릭해서 이전에 만든 텍스트 파일을 불러온다. 그리고 Next

사용자 삽입 이미지
사용자 삽입 이미지

제일 윗줄을 기준으로, 각 라인이 marker인지, category인지 등을 지정한다. Next..
최종적으로 입력된 데이터가 나온다. Finish.

이렇게 데이터가 입력된다.
사용자 삽입 이미지


이제 분석...
메뉴의 Analysis 에서 원하는 분석방법을 선택한다.
사용자 삽입 이미지


먼저 Summary Statistics를 들어가보면,
사용자 삽입 이미지

이렇게 나온다. Option에서 원하는 분석을 선택한다.
그리고 왼쪽의 Data and Result의 목록에서 아까 입력한 데이터를 선택.
Submit을 클릭하면 분석이 시작되고 결과가 나타난다.

아래는 Hardy Weinberg test 분석의 경우...
사용자 삽입 이미지

마찬가지로, 원하는 분석을 선택하고 데이터를 선택하고 Submit. 하면...

아래처럼 결과가 출력된다.
사용자 삽입 이미지

이 결과는 본문의 셀을 클릭하거나,
Explorer 창에서 오른쪽 클릭후 Excel로 열기를 선택하면 Excel로 변환할 수 있다.

Posted by 토리군
집단유전학 통계 프로그램(Population genetics data analysis program)
Powermarker  v3.25 (download)  &  manual download
(.Net framework 1.1 must installed)

Homepage =>> http://statgen.ncsu.edu/powermarker/index.html


<가능한 분석 목록>
Summary statistics
  • Compute sample size
  • Compute number of observation
  • Compute allele number
  • Compute availability (1 - missing proportion)
  • Compute gene diversity using biased or unbiased version
  • Compute polymorphism information content
  • Compute heterozygosity
  • Compute stepwise mutation index which was defined as the maximal proportion of alleles which follow stepwise mutation pattern
  • Compute moment estimator or maximum likelihood estimator of within-population inbreeding coefficient
  • Summarize result at any level
  • Bootstrap across loci to estimate confidence intervals
  • Estimate allele frequency and its variance
  • Bootstrap across individual to estimate confidence interval
  • Estimate genotype frequency and allele covariance
  • Bootstrap across individual to estimate confidence interval
  • Estimate haplotype frequency using EM algorithm
  • Estimate haplotype frequency using BisectionEM algorithm
  • Estimate haplotype frequency using TrioEM algorithm
  • Assign haplotype probabilities for each individual
  • Test Hardy-Weinberg equilibrium by ChiSquare test
  • Test Hardy-Weinberg equilibrium by likelihood ratio test
  • Test Hardy-Weinberg equilibrium by Exact test
  • Compute Hardy-Weinberg disequilibrium statistics
  • Bootstrap across individual to estimate confidence interval for Hardy-Weinberg disequilibrium statistics
  • Estimate linkage disequilibrium D
  • Estimate D'
  • Estimate RSquare
  • Estimate population attributable risk
  • Estimate proportional difference
  • Estimate Yule's Q
  • Estimate two-loci haplotype frequency for computing LD statistics
  • Test two-loci linkage equilibrium by ChiSquare test
  • Test two-loci linkage equilibrium by Exact test
  • Test multi-loci linkage equilibrium by Exact test
  • Prepare 2D matrix for 2D plot
Population structure
  • Estimate population structure with admixture
  • Estimate population structure without admixture
  • Estimate classic coancestry matrix
  • Estimate population specific coancestry matrix
  • Estimate classic two-level F-statistics assuming Hardy-Weinberg equilibrium
  • Estimate classic two-level F-statistics considering inbreeding
  • Estimate classic three-level F-statistics assuming Hardy-Weinberg equilibrium
  • Estimate classic three-level F-statistics considering inbreeding
  • Estimate population specific two-level F-statistics assuming Hardy-Weinberg equilibrium
  • Estimate population specific two-level F-statistics considering inbreeding
  • Bootstrap across loci to estimate confidence interval
Phylogenetic analysis
  • Estimate frequency from DataSet
  • Estimate distance based Frequency data using 19 different methods
  • Construct UPGMA tree
  • Construct NJ tree
  • Bootstrap across loci to construct multiple trees for tree consensus
Association study
  • Allele test
  • Genotype test
  • Trend test
  • Distance test
  • Exact test
  • Genotype based F-test
  • Haplotype trend regression for binary and quantitative traits
Design
  • Choose core set of lines by allele number, allelic diversity, allelic entropy. Selection can be done with simulated annealing, random search or exhaustive search under general constrains
  • Choose haplotype tagging markers from haplotype data
  • Choose haplotype tagging markers from genotype data
  • Choose haplotype tagging markers from trio data
Tools
  • Mantel test
  • Contigency table analysis
  • SNP identification from sequences
  • Parse Structure's result
  • SNP simulation under coalescence model
  • SNP simulation under coalescence model with recombination hotspots


<ScreenShots>

사용자 삽입 이미지
사용자 삽입 이미지


Posted by 토리군
Genographic project

제노그래픽 프로젝트는 인류의 기원과 이동경로를 확인하기 위한 연구로,
National geographic와 IBM이 주관하는 거대 프로젝트이다.

전세계적으로 여러 지역에서 집단별 DNA샘플을 채취하여
돌연변이를 조사함으로써 인류 집단이 어느 경로를 통해 어디에서 어디로 이동했는지를 밝히는 것이다.
쉽게 말하면, 인류의 아담이브가 처음에 어디에서 나타났고,
그 후손들이 어떤 경로로 이동해서 오늘날 전세계로 퍼졌는지를 알아내는 것이다.

사람의 유전자에는 단백질로 발현되는 부분과 발현되지 않는 부분으로 나뉘는데,
단백질로 발현되는 부분은 돌연변이가 생겼을 때 치명적일 수 있지만
발현되지 않는 부분은 생명에 지장이 없기 때문에 계속 지니게 되고, 후손에게 그대로 물려주게 된다.
이러한 돌연변이를 조사함으로써, 사람들을 각 인종, 지역별로 특정 그룹으로 나눌 수 있다.
이러한 돌연변이의 정도와 차이를 이용해서 각 그룹의 이동 경로를 추적할 수 있다.

하지만, 사람의 상염색체와 X염색체는 재조합이 일어나기 때문에 후손에게 전달되는 과정에서 뒤섞일 수 있다.
따라서, 이러한 분석에는 재조합이 일어나지 않는 Y염색체미토콘드리아 DNA (mtDNA)만 이용하게 된다.
Y염색체는 남성을 통해서만 전달되고, mtDNA는 여성을 통해서만 전달된다.
따라서, Y염색체의 조상형은 아담이 되고, mtDNA의 조상형은 이브가 되는 것이다.

이 그림은 mtDNA의 각 그룹에 대한 이동 경로를 그림으로 나타낸 것이다.
사용자 삽입 이미지

그리고 이 그림은 Y염색체 집단과 mtDNA집단을 모두 나타낸 그림이다.
(작아서 잘 안보이면 클릭해서 크게 보기 바란다.)
사용자 삽입 이미지


더 자세히 다루려면 너무 전문적이고, 너무 길어질것 같고 해서 여기까지만 하려고 한다.
(솔직히 글로 쭉 써내려갈 만큼의 아직 내 지식이 풍부한 것도 아니다.ㅋㅋ)


프로젝트 홈페이지에 가보면, 100달러에 키트를 팔고 있는데,
이 키트를 구입하면 자신의 구강세포를 채취해서 샘플로 보낼 수 있다.
이후 인터넷을 통해서 분석 결과를 볼 수 있다고 한다.

하지만, 이 결과는 자신이 어떤 집단에 속하는 지를 알 수 있을 뿐이고,
자신의 조상이 이주한 경로를 아주 세밀하게 알수 있는것은 아니라는 것을 알았으면 한다.
게다가, 유럽의 경우 집단이 뚜렷하게 구분되지만,
아시아는 훨씬 복잡하기 때문에 대락적으로만 알 수 있다.
그래도... 돈 있으면 한번 해볼만 한것 같다.


더 자세히 알고 싶으면 아래 두 책을 읽어보길 권한다.
사용자 삽입 이미지 사용자 삽입 이미지
"최초의 남자"                                "인류의 조상을 찾아서"

두 권 모두 제노그래픽 책임자인 '스펜서 웰스'가 쓴 책이다.

"인류의 조상을 찾아서"는 간단하고 쉽게 설명되어 있으므로 일반인이 읽기 편하고,
"최초의 남자"는 관련된 내용을 좀 더 상세하게 다루고 있다.




Posted by 토리군