Population Genetics statistical program
Arlequin 3.11 (download) & manual download

Homepage =>> http://cmpg.unibe.ch/software/arlequin3


<가능한 분석>
  The analyses Arlequin can perform on the data fall into two main categories: intra-population and inter-population methods. In the first category statistical information is extracted independently from each population, whereas in the second category, samples are compared to each other.

Intra-population methods:

Short description:

Standard indices

Some diversity measures like the number of polymorphic sites, gene diversity.

Molecular diversity

Calculates several diversity indices like nucleotide diversity, different estimators of the population parameter q.

Mismatch distribution

The distribution of the number of pairwise differences between haplotypes, from which parameters of a demographic (NEW in ver 3.x) or spatial population expansion can be estimated

Haplotype frequency estimation

Estimates the frequency of haplotypes present in the population by maximum likelihood methods.

Gametic phase estimation
(NEW in ver 3.x)

Estimates the most like gametic phase of multi-locus genotypes using a pseudo-Bayesian approach (ELB algorithm).

Linkage disequilibrium

Test of non-random association of alleles at different loci.

Hardy-Weinberg equilibrium

Test of non-random association of alleles within diploid individuals.

Tajima’s neutrality test

Test of the selective neutrality of a random sample of DNA sequences or RFLP haplotypes under the infinite site model.

Fu's FS neutrality test

Test of the selective neutrality of a random sample of DNA sequences or RFLP haplotypes under the infinite site model.

Ewens-Watterson neutrality test

Tests of selective neutrality based on Ewens sampling theory under the infinite alleles model.

Chakraborty’s amalgamation test

A test of selective neutrality and population homogeneity. This test can be used when sample heterogeneity is suspected.

Minimum Spanning Network (MSN)

Computes a Minimum Spanning Tree (MST) and Network (MSN) among haplotypes. This tree can also be computed for all the haplotypes found in different populations if activated under the AMOVA section.

   

Inter-population methods:

Short description:

Search for shared haplotypes between populations

Comparison of population samples for their haplotypic content. All the results are then summarized in a table.

AMOVA

Different hierarchical Analyses of Molecular Variance to evaluate the amount of population genetic structure.

Pairwise genetic distances

FST based genetic distances for short divergence time.

Exact test of population differentiation

Test of non-random distribution of haplotypes into population samples under the hypothesis of panmixia.

Assignment test of genotypes

Assignment of individual genotypes to particular populations according to estimated allele frequencies.

   

Mantel test:

Short description:

Correlations or partial correlations between a set of 2 or 3 matrices

Can be used to test for the presence of isolation-by-distance

   

<ScreenShots>
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지
사용자 삽입 이미지

Posted by 토리군
집단유전학 통계 프로그램(Population genetics data analysis program)
Powermarker  v3.25 (download)  &  manual download
(.Net framework 1.1 must installed)

Homepage =>> http://statgen.ncsu.edu/powermarker/index.html


<가능한 분석 목록>
Summary statistics
  • Compute sample size
  • Compute number of observation
  • Compute allele number
  • Compute availability (1 - missing proportion)
  • Compute gene diversity using biased or unbiased version
  • Compute polymorphism information content
  • Compute heterozygosity
  • Compute stepwise mutation index which was defined as the maximal proportion of alleles which follow stepwise mutation pattern
  • Compute moment estimator or maximum likelihood estimator of within-population inbreeding coefficient
  • Summarize result at any level
  • Bootstrap across loci to estimate confidence intervals
  • Estimate allele frequency and its variance
  • Bootstrap across individual to estimate confidence interval
  • Estimate genotype frequency and allele covariance
  • Bootstrap across individual to estimate confidence interval
  • Estimate haplotype frequency using EM algorithm
  • Estimate haplotype frequency using BisectionEM algorithm
  • Estimate haplotype frequency using TrioEM algorithm
  • Assign haplotype probabilities for each individual
  • Test Hardy-Weinberg equilibrium by ChiSquare test
  • Test Hardy-Weinberg equilibrium by likelihood ratio test
  • Test Hardy-Weinberg equilibrium by Exact test
  • Compute Hardy-Weinberg disequilibrium statistics
  • Bootstrap across individual to estimate confidence interval for Hardy-Weinberg disequilibrium statistics
  • Estimate linkage disequilibrium D
  • Estimate D'
  • Estimate RSquare
  • Estimate population attributable risk
  • Estimate proportional difference
  • Estimate Yule's Q
  • Estimate two-loci haplotype frequency for computing LD statistics
  • Test two-loci linkage equilibrium by ChiSquare test
  • Test two-loci linkage equilibrium by Exact test
  • Test multi-loci linkage equilibrium by Exact test
  • Prepare 2D matrix for 2D plot
Population structure
  • Estimate population structure with admixture
  • Estimate population structure without admixture
  • Estimate classic coancestry matrix
  • Estimate population specific coancestry matrix
  • Estimate classic two-level F-statistics assuming Hardy-Weinberg equilibrium
  • Estimate classic two-level F-statistics considering inbreeding
  • Estimate classic three-level F-statistics assuming Hardy-Weinberg equilibrium
  • Estimate classic three-level F-statistics considering inbreeding
  • Estimate population specific two-level F-statistics assuming Hardy-Weinberg equilibrium
  • Estimate population specific two-level F-statistics considering inbreeding
  • Bootstrap across loci to estimate confidence interval
Phylogenetic analysis
  • Estimate frequency from DataSet
  • Estimate distance based Frequency data using 19 different methods
  • Construct UPGMA tree
  • Construct NJ tree
  • Bootstrap across loci to construct multiple trees for tree consensus
Association study
  • Allele test
  • Genotype test
  • Trend test
  • Distance test
  • Exact test
  • Genotype based F-test
  • Haplotype trend regression for binary and quantitative traits
Design
  • Choose core set of lines by allele number, allelic diversity, allelic entropy. Selection can be done with simulated annealing, random search or exhaustive search under general constrains
  • Choose haplotype tagging markers from haplotype data
  • Choose haplotype tagging markers from genotype data
  • Choose haplotype tagging markers from trio data
Tools
  • Mantel test
  • Contigency table analysis
  • SNP identification from sequences
  • Parse Structure's result
  • SNP simulation under coalescence model
  • SNP simulation under coalescence model with recombination hotspots


<ScreenShots>

사용자 삽입 이미지
사용자 삽입 이미지


Posted by 토리군
[BT] News2008. 6. 24. 12:21
DNA로 姓을 찾는다

뿌리 찾고자 하는 남성 입양인에게 도움

2008년 06월 23일(월)
▲ 세대를 거쳐 아버지가 아들에게만 전해주는 것이 두가지 있다. 바로 성과 Y염색체이다. 
아 버지가 아들에게 그리고 그 아들이 자신의 아들에게, 이렇게 아버지에서 아들로 계속 이어지는 것으로는 무엇이 있을까? 아버지를 모른다거나, 입양되지 않은 한, 아들은 아버지로부터 김 씨인지, 이 씨인지, 박 씨인지 등과 같은 성을 물려받는다.

생 물학적으로는 어떨까? 아버지에서 아들에게로만 세대를 거쳐 계속 전달되는 것이 있다. 바로 Y염색체이다. 자식은 각 부모로부터 23개의 염색체를 물려받아 46개의 염색체를 갖는다. 그런데 아버지의 46개 중 아들에게만 넘어가는 것이 Y염색체이다. Y염색체는 사실상 성보다 더 확실한 부자간의 끈이다. 성은 중간에 바뀌는 일이 생길 수 있으니까 말이다.

Y염색체와 성 간의 공통점

어쨌건 성과 Y염색체는 둘다 아버지에게서 아들에게로만 이어지는 공통점이 있다. 그렇다면 이 점을 이용해 DNA로부터 성을 찾을 수 있지 않을까?

이런 생각이 실제로 가능하다는 소식이 영국의 국영방송 BBC에서 보도되었다. DNA가 이제 친자관계뿐 아니라 성씨까지도 찾아주는 시대가 온 것이다.

패 밀리트리DNA(Family Tree DNA)라는 이름의 유전 검사 회사는 12만5천 명의 남성으로부터 얻은 유전 자료로 Y서치라는 데이터베이스를 구축했다. 이 데이터베이스는 Y염색체에서 특정 성씨가 갖는 유전적인 표지를 무엇인지를 찾아내 만들어졌다.

패밀리트리DNA는 성을 찾고자 하는 고객에게 3가지 DNA 테스트 중 하나를 선택할 수 있도록 했다. 성에 대해 Y염색체에서 12개, 37개 또는 67개의 유전적인 표지를 쓸 것이냐 하는 것이다. 검사에 드는 비용은 각각 149달러, 259달러, 349달러이다.

Y서치를 이용한 유전검사는 지푸라기라도 잡고 싶은 심정의 입양인들에게 도움이 될 수 있다. 부모에 대한 어떤 정보도 갖고 있지 않은 입양인들은 자신의 성이라도 찾기란 매우 어렵기 때문이다.

너무 흔하지도 너무 희귀하지 않은 성이 적합

▲ 남성은 커다란 X염색체 1개와 자그마한 Y염색체 1개를 갖고 있다. 이 Y염색체는 세대를 거쳐 아버지에서 아들에게로만 전달된다. 
최근 Y서치를 이용해 자신의 원래 성을 찾고자, 최소 30명의 남성이 이 회사에 등록했다. 실제로 이 데이터베이스를 이용하는 고객은 어린 시절에 입양된 사람들이다.

한 예로, 챈들러 바버라는 37살의 광고카피라이터는 태어났을 때 입양되었다. 그는 Y서치 데이터베이스에서 리치라는 성을 가진 6명과 유전적으로 일치하며, 루에치라는 미국의 성을 가진 한 사람과도 상당히 일치한다는 결과를 받았다.

또 다른 한 예로는, 친부의 성이 페이지라는 사실을 당초부터 알고 있는 48살의 데드워드 세루로의 사례이다. 그는 패밀리트리DNA의 서비스를 통해 자신과 비슷한 성씨 유전자를 가진 22명의 결과를 받았다. 그런데 22명 중 11명의 성이 페이지이었다. Y서치 데이터베이스가 통계적으로 꽤 좋은 결과를 보여준 셈이다.

하지만 Y서치가 모든 성을 잘 찾아줄 수는 없다. 너무 흔하지도 너무 희귀하지도 않은 성이 딱 적당하다고 한다.

따 라서 현재 상황으로 볼때 우리나라처럼 김이박처럼 특정 성씨가 매우 흔한 경우에는 DNA를 이용한 성씨를 찾기란 쉽지 않다. 하지만 김이박에도 여러 파가 나뉘어져 있으니, 어쩌면 미래에는 DNA가 당신은 무슨 성씨에 무슨 파라고 말해줄지도 모른다.
박미용 기자 | pmiyong@gmail.com

저작권자 2008.06.23 ⓒ ScienceTimes

================================================================================================

- 잡담 >> 내가 하는 일과 관련된 내용이다보니 재밌다. Y염색체가 아버지를 통해서 남자에게만 유전되고, 성씨도 남자의 것을 물려받으니 가능한 듯 하다. 좋은 아이디어다. 참, 별걸로 다 돈을 벌려고 한다.ㅋㅋ
  하지만, 이건 말 그대로 유전적 정보만을 보여주기 때문에, 과거에 조상중에서 다른 집안에서 입양되거나 데려다 키워서 아버지가 다르거나 한 경우에는... 문제가 생길수도 있겠다. 혹은 요즘처럼 어머니의 성씨를 물려받을 수 있는 경우에는... 자신의 원래 아버지쪽이 누구인지 알 수도 있겠지만, 혹은 이런 내용이 고려되지 않게 되면 혼란스러울 수도 있을듯하다. 또, Y염색체를 이용하기 때문에 남자만 가능하다.
  이런걸 상업적으로 이용하려면 수많은 DNA데이터베이스를 갖고 분석을 거쳐야 할 것이다. 외국은 범죄자 데이터베이스등에 많은 데이터가 존재하기 때문에 저런 분석이 가능할지 모르지만... 본인 허가없이 DNA 샘플링도 할 수 없고, 간단한 개인정보가 포함된 데이터베이스조차 만드는게 법적으로 금지된 우리나라에서는 아직은 힘든 이야기일 것이다.
Posted by 토리군
[BT] News2008. 1. 25. 12:46
DNA 분자들은 제 짝을 알아본다

美연구진, DNA 이중나선구조의 화학적 작용 밝혀

2008년 01월 25일(금)

유전 정보를 담고 있는 DNA의 분자들은 마치 텔레파시가 통하는 것처럼 자기 짝을 멀리서도 알아보고 서로 결합하려는 움직임을 보인다는 사실이 처음으로 밝혀졌다고 라이브사이언스 닷컴이 24일 보도했다.

미국 과학자들은 생리화학지 최신호에 실린 연구보고서에서 DNA의 이중나선구조들은 다른 분자들의 도움 없이도 먼 거리에 있는 제 짝 분자를 인식하며 A,T,C,G 등 4종의 염기 가운데 A는 T에, C는 G에 화학적으로 끌리는 것으로 나타났다고 밝혔다.

지금까지 학자들은 DNA 나선구조가 맞는 짝을 탐색하기는 커녕 스스로 분자별로 정돈할 수 있다는 증거도 발견하지 못했었다.

연구진은 두 가닥 나선구조를 가진 DNA에 형광물질을 주입한 뒤 단백질이나 DNA분자간의 소통을 도울만한 어떤 물질도 들어있지 않은 소금물에 담그는 실험을 통해 같은 염기서열을 가진 DNA는 서로 다른 서열의 DNA 분자들에 비해 서로 결합하는 비율이 두 배나 높다는 사실을 발견했다.

한편 염기들을 한데 모으는 것으로 알려진 상호작용은 나선구조들을 결합시키는데는 작용하지 않는 것으로 나타났다.

즉 DNA의 이중나선 구조는 염기들을 안쪽에 간직하고 바깥 쪽에는 높은 전하를 띤 당과 인산염 분자들을 내세워 염기 결합력을 약화시킨다는 것이다.

연구진은 이런 현상이 무언가 초자연적인 것처럼 보이지만 DNA는 물리학의 법칙에 따라 움직이는 것이라고 설명했다.

당과 인산염 고리들은 분자들을 서로 밀어내도록 하지만 똑같은 DNA 나선구조들은 서로 꼭 들어맞는 곡선부를 갖고 있어 밀어내는 힘이 최소화된다는 것이다.

연구진은 텔레파시처럼 보이는 이런 현상 덕분에 DNA 분자들이 가지런히 정렬됐다가 후에 뒤섞이게 되는 것으로 추측하고 있다.

이런 방식은 암이나 노화, 기타 건강문제를 일으키는 DNA 결합상의 오류를 피하게 하며 DNA가 적절하게 뒤섞이는 것은 자손 간에 유전적 다양성을 보장해 양성 생식의 핵심적 기능을 수행하는 것이라고 연구진은 지적했다.

저작권자 2008.01.25 ⓒ 연합뉴스

=====================================================================================================

- 잡담 >> DNA가 서로 상보적으로 결합하여 이루어진다는 것은 알고 있었는데, 무작위로 떠다니다가 만나는 것이 아니라, 스스로 찾아다닌다는 말이다. DNA자체만 봤을때는 살아있다고 할만한 것도 아닌데... 이기적 유전자에 대한 이야기 만큼 놀라웠다.  생명이란게 정말... 알면 알수록 신기하다.
Posted by 토리군
Genographic project

제노그래픽 프로젝트는 인류의 기원과 이동경로를 확인하기 위한 연구로,
National geographic와 IBM이 주관하는 거대 프로젝트이다.

전세계적으로 여러 지역에서 집단별 DNA샘플을 채취하여
돌연변이를 조사함으로써 인류 집단이 어느 경로를 통해 어디에서 어디로 이동했는지를 밝히는 것이다.
쉽게 말하면, 인류의 아담이브가 처음에 어디에서 나타났고,
그 후손들이 어떤 경로로 이동해서 오늘날 전세계로 퍼졌는지를 알아내는 것이다.

사람의 유전자에는 단백질로 발현되는 부분과 발현되지 않는 부분으로 나뉘는데,
단백질로 발현되는 부분은 돌연변이가 생겼을 때 치명적일 수 있지만
발현되지 않는 부분은 생명에 지장이 없기 때문에 계속 지니게 되고, 후손에게 그대로 물려주게 된다.
이러한 돌연변이를 조사함으로써, 사람들을 각 인종, 지역별로 특정 그룹으로 나눌 수 있다.
이러한 돌연변이의 정도와 차이를 이용해서 각 그룹의 이동 경로를 추적할 수 있다.

하지만, 사람의 상염색체와 X염색체는 재조합이 일어나기 때문에 후손에게 전달되는 과정에서 뒤섞일 수 있다.
따라서, 이러한 분석에는 재조합이 일어나지 않는 Y염색체미토콘드리아 DNA (mtDNA)만 이용하게 된다.
Y염색체는 남성을 통해서만 전달되고, mtDNA는 여성을 통해서만 전달된다.
따라서, Y염색체의 조상형은 아담이 되고, mtDNA의 조상형은 이브가 되는 것이다.

이 그림은 mtDNA의 각 그룹에 대한 이동 경로를 그림으로 나타낸 것이다.
사용자 삽입 이미지

그리고 이 그림은 Y염색체 집단과 mtDNA집단을 모두 나타낸 그림이다.
(작아서 잘 안보이면 클릭해서 크게 보기 바란다.)
사용자 삽입 이미지


더 자세히 다루려면 너무 전문적이고, 너무 길어질것 같고 해서 여기까지만 하려고 한다.
(솔직히 글로 쭉 써내려갈 만큼의 아직 내 지식이 풍부한 것도 아니다.ㅋㅋ)


프로젝트 홈페이지에 가보면, 100달러에 키트를 팔고 있는데,
이 키트를 구입하면 자신의 구강세포를 채취해서 샘플로 보낼 수 있다.
이후 인터넷을 통해서 분석 결과를 볼 수 있다고 한다.

하지만, 이 결과는 자신이 어떤 집단에 속하는 지를 알 수 있을 뿐이고,
자신의 조상이 이주한 경로를 아주 세밀하게 알수 있는것은 아니라는 것을 알았으면 한다.
게다가, 유럽의 경우 집단이 뚜렷하게 구분되지만,
아시아는 훨씬 복잡하기 때문에 대락적으로만 알 수 있다.
그래도... 돈 있으면 한번 해볼만 한것 같다.


더 자세히 알고 싶으면 아래 두 책을 읽어보길 권한다.
사용자 삽입 이미지 사용자 삽입 이미지
"최초의 남자"                                "인류의 조상을 찾아서"

두 권 모두 제노그래픽 책임자인 '스펜서 웰스'가 쓴 책이다.

"인류의 조상을 찾아서"는 간단하고 쉽게 설명되어 있으므로 일반인이 읽기 편하고,
"최초의 남자"는 관련된 내용을 좀 더 상세하게 다루고 있다.




Posted by 토리군
[BT]2008. 1. 24. 15:55


미국의 한 생명과학 회사에서 만든 PCR 송 입니다.
PCR이란 생물학에서 DNA를 증폭하는 기술인데요.
아는 사람만 이해할 수 있겠지만... 아는 사람만 재밌는 뭐 그런 노래죠ㅋㅋ

The PCR Song

There was a time when to amplify DNA,
You had to grow tons and tons of tiny cells.

Then along came a guy named Dr. Kary Mullis,
Said you can amplify in vitro just as well.

Just mix your template with a buffer and some primers,
Nucleotides and polymerases, too.

Denaturing, annealing, and extending.
Well it’s amazing what heating and cooling and heating will do.

PCR, when you need to detect mutations.
PCR, when you need to recombine.
PCR, when you need to find out who the daddy is.
PCR, when you need to solve a crime.

(repeat chorus)




- http://kmtvx.tistory.com 에서 보고 퍼왔습니다.
Posted by 토리군