밀은 세계 3대 주요작물로서 탄수화물, 단백질 등을 많이 포함하고 있는 전 세계 인구의 약 30%가 주식으로 사용하고 있는 작물이다(Hannan et al. 2021, Kang et al. 2016). 국내에서는 연간 1인당 밀 소비량은 31.6 Kg으로 벼 다음으로 많이 소비되는 식량작물이이나 자급률은 1.1% 정도의 매우 낮은 수준이다(Min et al. 2021). 밀 소비량밀은 종실을 식용하는 타작물과는 달리 제분과정을 거쳐 밀가루로 식용을 하는 것이 일반적이며 이 과정에서 종실에 포함된 단백질에 의한 점탄성과 그 함량에 따라 다양한 용도로 사용되고 있다(Oh et al. 2019). 그렇기 때문에 가공적성이나 생육 환경에 따른 다양한 밀 품종의 개발이 중요하고, 밀 다양성이 확보된 집단의 연구가 중요하다. 특히 보통밀의 경우는 보통밀은(T. aestivum L., 2n=6x=42, AABBDD) 유전체 크기가 17 Gbp로 매우 방대한 이질 6배체의 거대 배수성 작물이기 때문에 유전체에 대한 데이터 수집이나 전장유전체 분석에 많은 제약이 있어 연구가 어렵다(Choi et al. 2018, Min et al. 2021). 보통밀은 높은 수량과 우수한 가공적성으로 전세계적으로 많이 이용되고 있으나 이질 6배체의 거대 유전체를 형성하기 까지 전체 유전체내 중복(whole genome duplication)과 유전체 구성에 따라 2배체, 4배체과의 이질 배수성을 형성하는 과정에서 다양한 유전자형을 가진 자원이 존재하고 있다(Choi et al. 2018, Lee et al. 2021). 이처럼 밀의 유전적 다양성이 증가하였기 때문에 다양한 생육 환경에 적응할 수 있었고 전 세계적으로 넓은 지리적 분포를 보이고 있으며 생물학적 다양성이 높아지고 있다(Dubcovsky & Dvorak 2007, Wendel 2000). 그렇지만 지나치게 높은 유전체의 중복으로 인하여 밀은 85% 이상의 반복서열을 가지고 있기 때문에 유전체 연구와 분자육종 연구가 매우 어렵기 때문에 2배체, 4배체의 다양성 집단을 활용한 육종연구가 진행되고 있다(Lee et al. 2021).
농업 유전자원은 작물 육종가나 다른 식물 연구 과학자들에게 중요한 재료이다. 이러한 재료를 연구 및 육종에 이용하기 위한 표현형, 유전형 평가는 매우 중요하며 이들의 다양성 정도가 유전자원의 활용도를 높이는 척도가 될 수 있다. 대규모의 수집자원에서 지리적, 형태적, 유전적 다양성을 분석하고 대표 자원을 선발하여 전체 모집단의 다양성을 반영한다면 자원 활용도를 높일 뿐만 아니라 유전자원의 효율적인 관리와 보존에도 기여할 수 있다. 이렇게 전체 집단의 다양성을 반영한 핵심집단의 개발을 통해 전체 자원의 평가를 위한 시간과 예산을 줄이면서도 육종 프로그램, 생명공학 연구 등에 유전자원의 활용을 촉진할 수 있다(Brown 1989, Duran et al. 2019, Hintum et al. 2000, Hodgkin et al. 1995, Zhang 2011).
육종연구에는 재래종, 야생종, 육성계통 등 다양한 유전자원이 활용되고 있으며 국제미작연구소(IRRI), 국제옥수수밀연구소(CIMMYT) 등의 농업연구를 위한 국제기구와 세계 각국은 유전자원의 안전 보존과 활용도 증진을 위해 종자은행(genebank)을 운영하고 있다. 종자은행에서 보존하고 있는 작물의 수집 자원에 대한 효과적인 관리와 보존을 위해 전체자원의 평가가 필요하고 동시에 핵심집단의 개발이 요구된다. 세계 각국은 밀 유전자원에 대한 핵심집단을 작성하여 자원의 다양성 보존과 관리에 이용함과 동시에 육종재료 선발, 신규 유전자 발굴 등 유전적 다양성의 활용에 집중하고 있다. 본 종설 논문은 국내 밀 유전자원과 이를 기반으로 한 핵심집단의 동향에 대해 살펴보고 다양한 내재해성에 대한 활용 방안에 대해 모색하고자 한다.
전세계적으로 야생근연종과 재래종을 포함한 약 560,000점의 밀 자원이 종자은행에 보존되고 있으며 이들 자원은 기후변화를 비롯한 여러 문제에 대응할 수 있는 아직 이용되지 않은 유전적 다양성을 포함하고 있다(Dempewolf et al. 2017, Hajjar & Hodgkin 2007, Maxted et al. 2012, Milner et al. 2019). 육종에서 유전자원의 이용을 촉진하기 위해서는 엘리트 자원으로 유용한 유전적 변이를 도입하기 위해 이들 변이를 가지고 있는 자원을 효율적으로 확인하는 방법을 찾아야 하며, 최근의 유전체학, 분자생물학적 기술 발달은 대규모의 유전자원 수집단이 보유한 유전적 다양성에 대한 평가를 좀더 쉽게 만들고 있다(Langridge & Waugh 2019, Müller et al. 2018).
작물 다양성과 유전자원의 관계를 고려하여 가장 많이 연구되고 구축하는 집단은 핵심집단이다. 핵심집단은 대규모 유전자원 수집단이 갖고 있는 유전적 다양성의 대부분을 보유하고 있으며 육종에서 이용할 수 있는 다양성 탐색을 위한 표현형조사가 시작되는 출발점이 된다(Romay et al. 2013, Singh et al. 2018, Vikram et al. 2016). 핵심집단은 특정 작물에 대하여 유전자원의 재래종, 수집종, 육성종 등 다양한 자원을 수집하여 유전적 다양성을 최대화하고 유전체의 중복성을 최소화하는 집단이다. 특히 밀의 경우는 거대한 유전체 크기로 인하여 핵심집단을 구축하여 다양성과 유전체 분석을 하는 연구들이 진행되고 있다(Min et al. 2021). 다음은 주요 밀 연구 국가에서 개발된 핵심집단이다.
CIMMYT는 자체보유 유전자원 및 국제건조농업연구센터(ICARDA) 종자은행에서 수집한 79,191 자원(밀 6배체 56,342점, 밀 4배체 18,946개, 야생근연종 3,903개)의 유전적 다양성을 조사하고 이들 자원을 대표하는 핵심집단을 구축하였다(Sansaloni et al. 2020). 56,342개의 6배체 자원(CIMMYT 81%, ICARDA 19%)은 8개의 재배화된 종들을 포함하며, 이 중 99%는 T. aestivum L. aestivum이었다. 이들 자원은 종자은행 데이터를 기반으로 재래종, 품종, 엘리트 육종 계통, genetic stock 등 7개의 하위 그룹으로 분류되었다. 집단구조 분석결과 (1) 멕시코 전통 재래종, (2) 이란과 터키의 전통 재래종, (3) 이란, 터키, 파키스탄의 전통 재래종, (4) 및 (5) 멕시코 유래 현대 재래종 두 그룹, (6) 및 (7) 합성 계통의 두 그룹, (8) 엘리트 밀 유전자원의 8개 그룹으로 분리되었다. 총 18,946개의 4배체 자원(CIMMYT 20%, ICARDA 80%)은 8개의 종들을 포함하며, 이 중 77.6%는 T. durum이고 재래종(55.8%), 엘리트 육종 계통(21.4%), 품종(3.2%), genetic stock (0.06%)의 4그룹으로 나뉘었다. 집단구조 분석결과 (1) 에티오피아에서 현저하게 구별되는 재래종 그룹, (2) 주로 북부 아프리카(모로코, 알제리, 튀니지)와 포르투갈이 원산지인 재래종, (3) 터키, 이란, 요르단, 시리아의 재래종, (4) 터키, 아제르바이잔, 이란, 러시아의 재래종, (5) 엘리트 라인, (6) T. diccocum의 소규모 자원 (7) 잠재적으로 6배체인 이상 자원의 7개 그룹으로 분리되었다. 80,000점에 가까운 전체 자원은 예상 이형 접합성(He2), inbreeding 및 Shannon 지수를 이용하여 전체 집단과 비슷한 유전적 다양성을 나타내는 핵심집단으로 재구성되었다. 핵심집단은 전체 모집단의 20%를 포함하며 각각 11,235, 3,157 및 746점의 6배체, 4배체 및 야생근연종 자원으로 구성되었다.
미국 농업연구청(USDA-ARS) National Small Grain Collection (NSGC)의 보통밀(T. aestivum L, subsp. aestivum) 유전자원은 42,138자원이며 1995년에 Brown (1989)이 제시한 방법을 따라 자원의 10%가 원산지별 층별 무작위 샘플링을 이용해 선발되어 핵심 집단(core subset)이 확립되었다. 핵심집단에서 각 국가에서 선발된 자원의 수는 각 국가의 자원수의 로그에 비례하였기 때문에 지리적 기원에 따른 넓은 대표성을 보였지만 자원이 많은 국가는 핵심집단에서 과소평가되는 경향이 발생하였다. 1997년에는 이란 재래종 6,484자원이 도입되고 이중 682자원이 핵심 집단에 포함되었다. 이들 이란 자원의 포함 여부는 association 분석에서 false positive의 증가 또는 SNP 탐색에서 편중된 경향으로 나타기도 했다(Cavanagh et al. 2013, Vilhjálmsson & Nordborg 2013). 2015년에 기존의 NSGC의 핵심집단 총 4,007 자원을 390개 diversity array technology (DArT) 마커와 4,941개 SNPs를 이용하여 재조사하여 3,230개의 informative core (iCORE)를 구성하였다(Bonman et al. 2015). Analysis of molecular variance (AMOVA) 분석 결과 원산지, 자원상태(품종 또는 육성계통, 재래종, 이란 재래종, 미상), 자원 획득 일자, 파성 등에 따른 자원 그룹은 iCORE 집단내의 변이를 많이 설명할 수 없었고 그룹내 자원간 변이가 더 컸음을 보여주었다. DNA 마커가 얼마나 유용한지를 나타내는 polymorphism information content (PIC) 값은 봄밀과 겨울밀이 각각 0.30과 0.27로 봄밀이 높았고 자원상태에서는 이란재래종이 0.19로 육성계통이나 품종의 0.29나 재래종의 0.28에 비해 낮은 값을 보였다. iCORE 집단에서 이란 재래종은 다른 재래종에 비해 낮은 다양성을 보였지만 밀의 bunt disease나 russian wheat aphid (RWA)와 같은 질병에 저항성을 갖는 자원이 많았다. 일반적으로 이 병들에 대한 저항성 자원은 기존의 핵심집단에는 매우 드물었기에 이란 재래종 자원이 이들 저항성 자원을 보강하였다.
일본 국립종자은행은 2002년 National Bioresources Project-Wheat (NBRP-Wheat)를 시작하여 밀 야생종, 재래종, 연구재료 등 약 12,000 자원을 수집, 보존하고 분양하고 있다. 이들 자원 중 일본에서 육종에 빈번하게 이용되는 품종과 지리적 분포와 6배체 밀의 분류학적 그룹을 대표하는 재래종으로 구성된 핵심집단을 구축하였으며 따라서 보통밀과 6배체 밀을 대표할 수 있다. 핵심집단은 총 188자원으로 T. aestivum (160자원), T. spelta (12자원), T. compactum (6자원), T. macha (4자원), T. sphaerococcum (3자원), T. vavilovii (2자원), 합성 6배체 밀 1자원으로 구성되었다(Takenaka et al. 2019). DArTseq을 통해 생산된 총 20,186 SNPs 마커를 이용해 genotyping을 수행하고 다양성 분석에 이용하였다. STRUCTURE 분석 결과 총 7개 그룹으로 구분되었으며 A 그룹은 28개 동아시아 보통밀과 1개 T. compactum 자원, B 그룹은 25개 자원으로 서남 중국, 히말라야 지역, 남아시아 자원들로 구성되었고 표준 품종인 Chinese Spring이 여기에 속했다. 또한 모든 T. sphaerococcum 자원이 그룹 B에 속했다. 그룹 C에는 보통밀 25자원(파키스탄, 아프가니스탄, 우즈베키스탄, 이란, 터키)과 T. vavilovii 2자원, T. compactum 2자원, T. spelta 1자원이 포함되었다. 그룹 D에는 서아시아와 유럽 유래의 혼합자원 28자원과 T. compactum 1자원이 속했고 그룹 E는 대부분 혼합자원인 22자원으로 구성되었으며 많은 현대 유럽 품종이 포함되었다. 그룹 G는 모두 보통밀이 아닌 6배체 밀로 구성되었다. 이들 집단 구조 분석은 각 군집의 자원들이 지리적 분포를 반영하고 있다는 것을 보여준다.
중국 국립종자은행은 23,090 밀 유전자원을 보존하고 있으며 78개 SSR 마커를 이용하여 후보 핵심집단 5,029자원의 유전적 다양성을 분석하였다. 단계적 계층화를 거쳐 총 1,160개의 자원으로 구성된 핵심집단을 작성했으며 여기에는 재래종 762자원, 현대 품종 348자원과 도입 품종 50자원이 포함되었다(Hao et al. 2008). 핵심집단은 후보 핵심집단과 전체 자원의 각각 23.1%, 5%에 해당하지만 후보 핵심집단 대립유전자의 94.9%를 보유하고 전체 자원의 유전적 다양성의 91.5%를 담보하고 있다. 78개 SSR 마커에서 총 1,557개 대립유전자가 증폭되었고, 재래종과 현대품종에서 각각 1,408개와 1,158로 나타났다. 증폭된 대립유전자 중 374개는 재래종에서만, 124개는 현대 품종에서만 검출되었다. 핵심집단의 유전적 구조를 분석한 결과 기본적으로 2개의 기초 집단(재래종과 현대 품종)으로 나뉘었으며 재래종은 품종보다 더욱 강력한 유전적 차이를 나타내었으며 이는 오랜 기간의 생태학적 선발과 관련되었다. 중국의 10개 생태학적 지역간의 대립유전자 수에는 큰 차이가 있었다. 대립유전자 수는 재래종에서 515~952개 범위, 현대 품종에서 189~801개의 범위로 나타났으며 재래종에서 더 많은 대립유전자가 검출되었다. 각 생태학적 지역에서 선발된 핵심집단의 유전적 다양성을 비교한 결과 재래종은 지역 2 (Yellow and Huai River valley winter wheat region)가 가장 높은 유전적 풍부함을 보였고 지역 4 (Southwestern winter wheat region)가 그 뒤를 이었다. 지역 1 (Northern winter wheat region)과 8 (Northwestern spring wheat region)은 비교적 높은 유전적 풍부함을 보인 반면 지역 5 (Southern winter wheat region), 6 (Northeastern spring wheat region)은 가장 낮았다. 지역 2와 4는 중국 보통밀 재래종의 다양성 중심에 있음은 이후 연구에서 확인되었다. 지역 2는 현대 품종에 있어 가장 높은 유전적 다양성을 포함하였고 지역 1 (Northern winter wheat region)은 2번째로 높은 유전적 다양성을 나타내었다. 지역 5와 9 (Qinghai-Tibet spring-winter wheat region)는 가장 낮은 유전적 다양성을 보였다.
인도 국립종자은행에 보존되고 있는 3개의 다른 종의 밀 22,416자원(18,061 보통밀, 3,860 듀럼밀, 495 엠머밀) 조사하여 핵심집단을 구축하였다(Phogat et al. 2021). 종과 원산지에 따라 1차로 그룹을 만들고, 각 그룹에 농업형질 데이터를 적용하였다. 최종적으로 2,226자원으로 구성된 핵심집단을 구축하였으며 보통밀(T. aestuvum L.) 1,779자원, 듀럼밀(T. turgidum L. subsp. durum) 394자원, 엠머밀(T. turgidum L. subsp. dicoccon) 53자원이 포함된다. 보통밀 핵심집단은 인도의 지리적, 농업생태적 지역과 모든 대륙을 대표할 수 있으며 인도자원 1,194자원과 해외자원 585자원으로 구성되었다. 듀럼밀은 거의 같은 수의 인도자원(1,918)과 해외자원(1,942)이 보존되고 있으며 듀럼밀 핵심집단은 216 인도자원과 178 해외자원으로 구성되었다. 엠머밀은 주로 Karnataka와 Andhra Pradesh주에서 유래한 34 인도자원과 19 해외자원을 포함한다. 핵심집단의 질을 평가하는 4개의 지표 중 mean difference percentage (MD)가 20% 이하로 나타나 전체집단과 핵심집단에 차이가 없음을 보여주었고 variance difference percentage (VD)에 대해 전체집단과 핵심집단의 분산이 같지 않았다. 핵심집단에서 모든 형질의 분포 범위가 전체집단 분포를 잘 반영하는지를 나타내는 coincidence rate of range (CR) 지표에서 3개 종에서 평균 CR이 80% 이상으로 이는 표현형 형질에 대한 균등한 분포 범위를 보여주었다. 핵심집단이 전체집단을 대표하기 위해서는 100% 이상의 variable rate of the coefficient of variation (VR)이 필요하며 구축된 핵심집단의 VR은 보통밀 153.4%, 듀럼밀 161.05%, 엠머밀 104.96%로 전체 유전자원을 대표할 수 있었다.
프랑스 국립농업연구소(INRA) 유전자원센터는 10,000점 이상의 6배체 밀 수집 자원을 보존하고 있으며 1/3은 프랑스 원산 수집자원, 1/3은 유럽 원산, 나머지 1/3은 세계 각국의 자원이다. 전세계적인 밀 다양성을 대표하는 자원을 선발하기 위해 73개국 원산의 3,942자원을 38개 SSR 마커로 분석되었고 최종적으로 372자원으로 구성된 핵심집단을 구축하였다(Balfourier et al. 2007). 최초 분석한 3,942자원은 각 지리적 그룹의 자원수에 따라 선발했으며 러시아 바빌로프 연구소의 350여 자원(러시아, 중앙아시아, 코카서스, 아시아 국가들)이 포함되어 있다. 이들 자원에 대한 SSR 마커 분석 결과 locus 당 대립유전자수는 7개에서 45개, 평균 23.9개가 검출되었고 38개의 유전자좌에서 총 908개 대립유전자가 탐색되었다. 최종 372 핵심집단은 908개 대립유전자 중 892개를 보유했다. 이들 대립유전자는 전체 대립유전자 다양성의 98% 이상을 나타내며 결과적으로 핵심집단과 전체집단에 대립유전자의 편향된 분포는 없었다. 핵심집단의 45개 지리적 그룹간 계통도는 유럽, 오세아니아, 북아메리카 원산자원과 그 이외 지역의 자원을 분명하게 구분했다. 첫번째 하위그룹은 북서 유럽국가들이었고 두번째 하위그룹은 남동 유럽국가들이었으며 지중해 국가들(이탈리아, 알바니아, 스페인 등)은 세번째 하위그룹을 형성했다. 북미 국가들과 오세아니아 국가들은 같은 그룹으로 묶였으며 근동 지역과 중앙 아시아 지역(터키, 코카서스, 러시아, 중앙아시아, 아프간-이란-이라크)은 같은 하위그룹에 속했다. 극동 국가들은 또다른 하위 그룹을 형성했고 아프리카, 남아메리카 국가들은 같은 하위 그룹을 형성했다.
국립공주대학교는 농촌진흥청 농업유전자원센터 보유자원 1,267점과 식량과학원의 고세대 계통 700점을 포함하여 총 1,967자원에 대해 21개 농업특성을 조사하고 37쌍의 SSR 마커를 이용하여 분석한 후 최종적으로 614자원으로 구성된 핵심집단을 구축하였다(Min et al. 2021). 최초 유전자원의 원산지는 멕시코 367자원과 국내자원 342점이 가장 많은 원산지로 나타났으며 멕시코 원산 자원은 국제옥수수밀연구소(CIMMYT) 자원이 다수 포함되어 있고 국내 자원의 경우 우리나라 재배환경에 적합한 계통 탐색을 위해 육성계통도 포함되었다. 그 다음으로 중국 159, 미국 155자원이 포함되어 이들 4개 원산지가 가장 많은 비율을 차지하였다. SSR 마커 분석 결과 마커당 대립유전자수는 0.54에서 2.29개 범위를 보였고 평균 1.58개가 검출되었다. 핵심집단의 STRUCTURE 분석결과 크게 7개의 그룹으로 나눌 수 있었다. 19가지 농업형질과 출수기, 성숙기에 대하여 총 1,450개의 연관마커 후보군을 선발하였고 도복, 한해와 같은 양적형질에 대해서는 158, 32개의 많은 마커를 발견하였으며 출수기, 성숙기의 경우 각각 97, 105개의 마커가 탐색되었다.
각 나라별 개발된 핵심집단 현황은 Table 1에 정리하였다.
프랑스 농업연구소(INRA)는 INRA Biological Resources Center에 보존 중인 보통밀 12,000 자원에서 선발한 전세계 유전자원 집단 4,506 계통을 이용하여 다양성 분석을 수행하였다(Balfourier et al. 2019). 이들 자원은 전세계의 재래종(14%, 632), 녹색혁명 이전 등록된 품종(21%, 965), 1960년 이후 등록된 현대 품종(51%) 등으로 구분되었다. Genotyping은 Affymetrix Axiom SNP array (280,226 SNPs)를 이용하였다. 4,506 자원은 105개 원산으로 구성되었으며 유럽 33개국 2,185자원, 러시아 28개 지역 143자원, 미국 29개주 및 캐나다 5개주 534자원, 아시아 946자원(중국 24개 성 384자원), 남아메리카 14개국 316자원, 아프리카 20개국 207자원, 오세아니아 169자원으로 전세계의 지리적 기원에 따른 다양성을 반영할 수 있었다. 재래종의 집단구조 분석 결과 지중해, 북동유럽, 남동유럽 자원이 가장 혼합된 집단이자 가장 다양한 그룹이었고(Nei diversity index (He)= 0.47, 0.45, 0.44) 가장 높은 희귀 대립유전자를 나타냈다. 동남아시아와 이베리아 반도는 가장 구별되는 그룹이었고(Fst=0.32, 0.36), 이는 집단간 유전적 유사도를 평가하는 Fixation Index (Fst)에서 유의미한 차이를 보였다(Fst=0.32, 0.36). 지중해, 북동유럽, 남동유럽 자원은 서로 간에 크게 구별되지 않았다(Fst= 0.10). PCoA 결과는 아시아와 유럽 2개의 분화축을 보여주며 이 둘은 지중해 근처로 집중되어 기존의 풍요한 초승달 지역에서 밀의 재배화가 이루어졌다는 기존 주장과 일치했다. 밀의 확장은 지중해 지역에서 시작되었으며 2개의 주요한 인간 이동 경로에 따라 새로운 환경으로 분화되었는데 하나는 풍요한 초승달 지역에서 유럽(다뉴브 루트를 따라 남동유럽과 북서유럽)으로, 다른 하나는 실크로드를 따라 아시아로 이동했다. 전세계적인 밀 계통도 분석 결과 아시아 육종 프로그램은 주로 유럽 자원, 특히 이탈리아 자원을 주로 이용했음을 보여주었다. 또한 아시아 자원은 현대 품종 육성에 거의 이용되지 않았고 북유럽과 서유럽 육종 프로그램에서는 지역 재래종 자원을 이용했음을 알 수 있었다. 대부분의 전세계 현대 품종은 남동유럽, 이베리아 반도, 지중해 지역의 재래종과 관련이 있고 북동유럽 재래종은 서부 유럽 현대 유전자원에 기여했다. 또한 야생근연종의 이용은 결과적으로 기존 밀 게놈에 의미있는 양의 외부 DNA의 도입으로 이어졌다.
영국 브리스톨 대학교 연구팀은 Watkins Collection (WC)을 이용하여 유전적 다양성을 분석하였다(Winfield et al. 2018). WC는 아시아, 유럽, 아프리카의 32개국 재래 시장에서 1920년대와 1930년대에 수집된 804 자원으로 구성되며 현대적인 육종이 시작되기 전에 존재한 유전적 다양성을 대표하는 가치있는 재래종 자원으로 평가받는다. 또한 rust 저항성 신규 유전자좌의 확인을 위해 사용되었다(Bansal et al. 2011, Bansal et al. 2013). 연구팀은 Axiom wheat HD Genotyping Array와 Axiom wheat Genotyping Breeders’ Array 2종류를 사용하여 자원을 genotyping 하였다. 집단구조 분석결과 서유럽(영국, 스페인, 이탈리아, 포르투갈, 그리스, 프랑스 등) 자원은 동유럽(불가리아, 핀란드, 헝가리, 폴란드, 루마니아, 유고슬라비아 등) 자원과 구분되었다. 동유럽 그룹은 대부분 겨울밀 자원을 포함했다. STRUCTURE 분석 결과 804자원은 크게 3그룹으로 나뉘었으며 그룹 1은 아시아와 중동지역의 자원, 그룹 2는 서유럽과 북아프리카 자원이 주를 이루었고 그룹 3은 동유럽과 아시아 자원이 묶여 집단을 형성하였다. 구소련의 자원은 하나는 동유럽과 같은 그룹으로, 다른 하나는 아시아/중동 자원과 그룹을 형성하였으며 구소련 자원 중 우크라이나와 동부 러시아에서 수집된 자원은 동유럽 자원과, 코카서스에서 수집된 자원은 중동과 아시아 자원과 매우 비슷했다. 현대 엘리트 품종과 WC 자원의 다양성 분석에서 WC의 호주 자원은 현대 호주 품종과 같은 그룹을 형성하지 않았는데 이는 현대 호주 품종이 지역 재래종에서 유래되지 않았다는 것을 나타내며 대부분의 호주 품종은 CIMMYT 종자은행과 육종 프로그램에서 유래한 유전자원을 활용하기 때문에 호주의 엘리트 품종들 역시 중앙 아메리카(CIMMYT)와 같이 위치하였다. 자원 집단분석으로 유추할 때 동남부 터키 지역에서 밀의 재배화가 시작된 후 2가지 경로로 유럽으로 확장되었으며 하나는 발칸과 다뉴브를 따라 북쪽으로 진행했고 다른 하나는 이탈리아, 프랑스, 스페인을 지나 최종적으로 영국과 스칸디나비아에 도착했음을 알 수 있었다. 호주와 동유럽의 재래종 자원은 새로운 다형성 수의 측면에서 가장 적은 풍부함을 보였고 중동과 북아프리카 자원은 가장 많은 수의 신규 다형성 대립유전자를 갖고 있었다.
국제건조지역농업연구센터(ICARDA)는 32개국에서 수집된 듀럼밀 엘리트와 재래종 사이에 공유되는 집단 구조와 유전적 다양성을 조사하였다(Kabbaj et al. 2017). 총 370 자원의 유전자형이 Axiom 35K array를 사용하여 분석되었고 8,173개의 단일 염기 다형성(SNPs)을 확인하였다. DAPC 분석결과 이 집단의 적정한 하위 그룹은 10개로 추정되었고 이들 그룹의 AMOVA 분석에서는 전체의 유전적 변이 중 31.5%는 집단간, 68.3%는 집단 내 개인에 의해 설명되었다. 10개 클러스터 중 4개 그룹은 재래종으로 구성되었으며, 6개 그룹은 대부분 품종과 엘리트 계통을 포함하였다(Fig. 1). 클러스터 1 (Middle East)은 PIC= 0.04로 가장 낮은 유전적 다양성을 나타냈고 클러스터 5 (‘Om Rabi’ derivatives) (PIC=0.05)가 두번째로 낮았다. 이 두 클러스터는 분리 마커의 빈도가 각각 0.13과 0.19로 가장 낮았으며 희귀 대립 유전자도 발견되지 않았다. Ethiopian landrace (T. abyssinicum type, 클러스터 2)은 Developed countries (클러스터 8)의 육종 프로그램에서 관찰된 것과 비교하여 낮은 수준의 대립 유전자 분리(42%)를 보였으며 매우 적은 희귀 대립 유전자(1%)도 똑같이 포착되었다. Central and South Asian (클러스터 4)은 PIC가 0.22이고 거의 모든 마커가 분리되어 있고(0.84) 희귀 대립유전자의 62%를 포착하여 유전적으로 가장 다양한 하위 그룹이었다. 현대 유전자원 중에서 클러스터 7 (Breeding program exchange)과 9 (ICARDA derived)는 가장 다양했으며, 전체 대립 유전자의 58%와 51%가 검출되었고, 하위 집단에서 각각 4%와 3%의 희귀 대립 유전자가 나타났다. 흥미롭게도 클러스터 10 (CIMMYT derived)은 현대 유전자원 중에서 가장 높은 수준의 희귀 대립유전자(21%)를 유지하였다. 또한, 재래종의 계통발생학적 분석에 따르면 에티오피아는 이전에 믿어졌던 두 번째 재배화의 장소가 아니라 듀럼밀의 두 번째 원산지일 수 있다.
여러 연구들에서 밀 육종 프로그램에 유전적 다양성 활용을 증진하기 위해 대규모 유전형 데이터를 이용해 왔다. 외래 자원과 CIMMYT 엘리트 라인의 교배에서 나온 계통에 대한 DArTseq과 표현형 데이터 분석을 통해 외래 자원의 육종 기여 효과를 보여줬다(Singh et al. 2018). CIMMYT가 보유한 8,416 멕시코 재래종과 2,403 이란 재래종을 이용한 genomic-based prediction에서 멕시코 자원에 대한 예측 정확도는 0.41~0.65, 이란 자원은 0.18~0.65로 추정되었다(Crossa et al. 2016). 엘리트 계통과 다양한 유전자원을 포함한 803점의 봄밀을 이용해 밀 수량과 계절 관련 특성의 유전체 예측 모델을 개발하고 평가하였으며(Saint Pierre et al. 2016), 건조와 고온 스트레스 저항성 후보 유전자에 발굴과 이를 pre-breeding에 적용하기 위해 1,423 봄밀 유전자원에서 200점의 다양한 유전자원을 선발했다(Sehgal et al. 2015). 또한 대규모 밀 엘리트 자원을 이용하여 다양한 환경에서의 GWAS를 통해 수량과 수량 안정성에 관여하는 유전자 위치를 확인하는 연구도 진행되었다(Sehgal et al. 2017). Mourad et al. (2020)은 103점의 봄밀 유전자원에 대해 GBS 유래 SNP를 이용하여 A, B, D 게놈에 대한 linkage disequilibrium (LD)을 분석하였고 D 게놈이 A, B에 비해 더 높은 거리에서 LD가 붕괴함을 보여주었다.
수발아는 대표적인 밀 생육후기의 수분재해로서 밀 품질 저하에 큰 영향을 미친다. 일반적으로 수발아는 종자의 휴면타파와 연관지어 연구가 되고 있으며 핵심집단이나 밀 유전자원을 이용한 수발아 및 종자휴면에 대한 연구가 진행되고 있다. 수발아에 대한 연관 유전자를 발굴하기 위하여 전장유전체 연관분석(GWAS, genome wide association study) 분석이 진행되고 있다. 중국의 밀 핵심집단 80개에 대하여 MTA (marker-trait associations)를 분석하여 수발아 저항성에 대한 기초 연구를 진행하였다(Lin et al. 2017). 이 연구를 통해 휴면과 관련된 유전자원 및 유용 유전자를 발굴하였다. Chang et al. (2010)은 중국 밀 germplasm의 미니핵심집단을 이용하여 3B 염색체에 존재하는 수발아 저항성 대립인자인 Vp-1B를 찾아냈으며 이 대립인자는 밀 종자의 휴면성을 크게 증가시켰다. Zhang et al. (2010)에서도 역시 종자 발아율을 이용하여 중국재래종의 138 미니 핵심집단을 이용하여 수발아 연관 4개의 SSR 마커(Xbarc57, Xbarc294, Xbarc310, and Xbarc321)로 수발아 및 종자 휴면성을 분석하였다. 이 연구를 통하여 “Vp1-b2”와 “Xbarc29”의 조합이 가장 높은 종자 휴면성에 영향을 갖는 마커이며 각 65.8%, 61.2%의 표현형과의 연관성을 입증하였다. 최근에는 중국 재래종의 717 germplasm 집단을 이용하여 발아율을 이용하여 DArT와 178,803 SNP 마커를 이용하여 전장유전체 연관 분석을 진행하여 3A, 3B, 5D 지역에서 높은 종자휴면성을 갖는 QTL 지역을 찾아냈으며 특히 3A, 3B에서 발견된 QTL은 Tamyb10으로 밝혀졌다(Zou et al. 2017).
유전자원 다양성을 이용한 종자 휴면검정을 통한 수발아 연구가 진행되었다. Nave et al. (2016)은 4배체 Emmer 밀을 이용하여 4번 염색체 B subgenome에 종자 크기 및 종자 휴면 상태의 차이에 관여하는 QTL이 동시에 위치한다는 것을 밝혀내었다. 이 QTL은 QGD-4BL이라 칭하였으며, 소수의 종자 크기 및 휴면 상태의 차이는 다기능성의 단일 유전자 또는 밀접하게 연결된 유전자 세트에 의해 조절될 수 있다고 추측되고 있다. Triticum dicoccoides은 시간이 지남에 따라 이삭 내의 종자 위치가 발아에 미치는 영향과 야생 emmer 밀 개체군 4 계통의 건조도 기울기에 따른 이삭 내 종자 휴면 차이의 기여를 추정되고 있는데, 이삭의 가장 아래쪽 종자(첫번째 florete)의 휴면성이 높았고, 모든 계통에서 동일한 경향성을 보였다. 네 계통 중 건조도가 가장 높은 지역일수록 휴면성이 강하다는 것을 확인하였다(Volis 2016).
밀가루와 도우의 품질에 대하여도 글로벌 밀 핵심집단을 이용한 연구가 진행되었다. Bordes et al. (2011)은 372종의 밀 핵심집단에 대하여 DArT, SSR, SNP를 이용하여 종실 단백질 함량, 종자의 단단한 정도, 아라비노자일란의 함량(WEAX, water-extractable arabinoxylan viscosity), 반죽의 물성을 분석하였다. 총 803개의 마커를 분석하여 130개의 마커극 이용하여 각 형질별 분석을 통한 품질 관련 인자들을 발굴해 내었다. 또한 372종의 핵심집단에서 196개의 빵밀 자원을 추출하여 질소 저항성을 분석하여 처리된 질소 수준에 따른 종자 수량과 단위 면적당 종자수와 단백질 함량과의 연관관계를 분석하였다. 이를 통하여 54개의 품질 관련 형질 들을 찾아내고 품종 기반 육종의 기초자료로 활용하게 되었다(Bordes et al. 2013)
야생 emmer 밀 역시 품질 연구에 활용되고 있는데, 중국에서는 총 27개 계통의 반죽 특성을 분석하여 였으며 모든 시료의 수분 흡수율(WA), 발육 시간, 안정성 시간, 연화 정도(4가지 반죽 유변학적 파라미터)를 기준으로 분석 결과, 일부 시험 재료에서는 밀가루 품질이 좋은 것으로 나타났지만 대다수는 물성이 좋지 않은 것으로 나타났다(Zhang et al. 2016). 또한 일반적으로 밀가루 품질이 크게 다른 야생 emmer 밀 TD-129와 TD-51의 두 가지 계통(accession)에서 밀가루 품질을 심층적으로 분석하였으며, 특히 밀 D 게놈이 없는 TD-129는 WA, ST, Mid-line peak time, angle of descent and gluten index reaching 등이 글루텐 품질이 높은 수준에 도달하는 것을 확인하였으며 TD-129의 배유 저장 단백질에 제빵 품질을 개선하기 위해 일반 빵밀에 적용할 수 있는 고품질 유전자가 포함되어 있을 수 있음을 예측할 수 있다(Zhang et al. 2016).
스페인에서는 고성능 유전체 분석 기술(DArTseq)을 사용하여 스페인 빵 밀 522핵심 콜렉션과 스페인 고유의 밀 품종을 활용하여 좀 더 높은 핵심집단을 구축하였으며 50 KSNP 마커를 활용하여 유전적 다양성을 확보하였으며 다양한 표현형데이터들을 활용하여 보다 효육적인 밀 육종이 가능할 것으로 예상된다(Pascual et al. 2020).
러시아에서는 빵밀 133종 집단을 이용하여 4배체 밀 친척과의 교배를 통해 얻은 IL(Introgression Line)로 구성된 밀 패널에 대해 유전체 전체 연관성 연구(GWAS)를 수행하여 2A와 7B 염색체의 QTL에는 각각 3개와 6개의 연결된 SNP 마커가 포함되어 있는 것으로 밝혀냈다(Leonova et al. 2023). 이는 기존에 보고된 QTL 분석과 비교한 결과 T. timophevii에서 새롭게 발견된 염색체 2A의 유전자좌를 포함하는 계통의 글루텐 함량은 다른 밀 품종에 비해 상당히 높은 것으로 밝혀져서 농업적 활용 가능성을 높였다(Leonova et al. 2023).
그리스 재래종의 밀가루는 상업용 밀가루보다 미량 영양소, 페놀 함량 및 항산화 활성이 더 높았다(Skendi et al. 2023). 그리스 재래종은 가장 높은 단백질 함량(16.62%) 외에 가장 높은 페놀산 함량(19.14μg/밀가루)을 보인 반면, 상업용 정제 emmer 밀가루는 가장 낮은 함량(5.92 μg/밀가루)을 나타냈다. 이 연구의 결과는 조사된 그리스 재래종 밀이 인간의 건강에 유익한 효과를 가진 미량 원소, 페놀류 및 항산화 물질의 가능한 공급원으로 간주될 수 있으며 적절한 빵 제조 절차를 사용함으로써 고품질 빵을 생산할 수 있음을 보여주고 있다(Skendi et al. 2023).
발아시킨 고대밀(emmer,einkorn)을 활용하여 빵의 기능적 특성을 개선하기 위한 연구도 진행되고 있는데, 발아 emmer 밀가루 첨가에 따라 페놀 및 항산화 활성이 높아지는 것을 확인하였으며, einkorn을 활용한 빵에서는 루테인 함량이 가장 높은 것을 확인하였다(Cankurtaran-Kömürcü & Bilgiçli 2023).
밀 이삭의 숙기 및 출수기를 바탕으로 한 조숙은 우리나라 밀 재배에서 매우 중요한 형질이다. 밀 유전자원의 표현형적 특성은 국내 품종이 가장 앞서 있으며 핵심집단을 통한 연관 분석이 계속 진행되고 있다(Min et al. 2021). 해외 자원은 국내 자원에 비하여 숙기가 늦기는 하나 GWAS 분석은 다양한 국가에서 다양한 자원으로 진행되고 있다.
이탈리아의 경우, 일반 재배밀을 개선하는데 유전적 다양성을 제공할 수 있는 263개의 야생 emmer 밀 유전자형에 대한 GWAS 분석을 수행하여 총 16개의 개화 관련 SNP를 탐색하였고 그 중 다양한 농업형질과 개화 시기를 나타내는 95개의 유전자형을 선별하여 VRN-A1 및 VRN-B1 유전자의 염기서열 변이를 비교 분석하였다(Strejčková et al. 2023). 이 연구에서 집단 내에 존재하는 대립인자 분석을 통하여 코딩 영역과 비코딩 영역 모두에서 여러 돌연변이를 발견하고 선택된 7가지 유전자형의 발현을 확인하였으며 이를 4배체 밀과 6배체 빵밀 육종 프로그램에 활용될 것이라고 보고 하였다.
터키에서는 T. monococcum (2배체)밀 자원인 ID1623와 MONLIS로 RIL집단을 구축한 후 출수와 연관된 QTL을 탐색하여 2A번과 5A번 염색체에서 발견하여 조숙 형질과 비교하여 연구되고 있다(Sesiz U et al. 2021).
일본에서는 밀 핵심집단을 활용하여 SNP 유전자 분석 및 GBS 기술을 활용하여 자국의 밀 품종을 기반으로 한 핵심집단이 더 정밀한 육종이 가능하게 개선이 이루어냈으며, 이 연구를 통하여 일본 밀에 대한 미니핵심집단의 구축과 GWAS 분석을 통해 출수기 등 다양한 숙기 관련 형질에 대한 분석을 진행하고 있다(Kobayashi et al. 2016).
프랑스에서는 유럽 중심의 유전자원으로 빵용 밀 핵심집단을 구축하였으며 이 집단은 다른 핵심집단들과 달리 프랑스 계통의 유전자원 비율이 매우 높았고 모집단 3,942자원에 대해 평균 372CC 집단을 구축하였다(Balfouier et al. 2007). 이 핵심집단을 이용하여 출수시기와 간장, 내냉성, 천립중 등 숙기 기반 기초 농업형질에 대한 표현형데이터를 확보하였으며 38개의 SSR마커세트를 활용하여 유전적 다양성을 최대화한 연관 분석을 진행하였다(Balfouier et al. 2007).
러시아에서는 CS (Chinese Spring)과 에머밀인 T. dicoccoides와 교배한 계통들에 대하여 에머밀에서 유래된 5B의 Vrn-B1 유전자를 연구하였다(Kiseleva et al. 2016). CS-5Bdic (에머밀 대체 계통)에서도 출수기에 대하여 조사하였으며 표현형(개화일) - 유전형 연관 분석을 통해 5B 염색체의 중심 영역에 있는 78개의 마커가 개화일 변이와 유의미하게 관련되었습니다. 이 과정을 통하여 모델 작물 유전체와의 일치성을 기반으로 WRKY, ERF/AP2 및 FHY3/FAR1를 조숙과 연관된 가장 유력한 후보 유전자를 발굴하였다(Kiseleva et al. 2016).
인도에서는 T. timopheevii (4배체)를 모계로 하고 일반밀을 부계로 하여 Cytoplasmic Genetic Male Sterility (CGMS) 시스템을 통한 교배 후 F1 하이브리드 세대(45계통)를 구축하였으며 이를 이용하여 개화일, 식물 키, 식물당 분재 수, 꽃대당 꽃 구근 수에 대한 정보를 수집하여 새로운 밀 육종프로그램에 적용하였다(Guin et al. 2019).
숙기에 해당되는 형질은 다양한 유전자원에서 다른 저항성과 연관되는 경우들이 발견된다. 이스라엘에서는 IW72 (T. dicoccoides)라는 계통에서 곰팡이가루병에 대한 저항성을 발아시기와 성숙시기에 확인하였으며 xgwm344, xwmc525등과 같은 SSR마커를 활용하여 7A 염색체에서 저항성인 MIW72 유전자가 Pm1과 연관이 있을 것으로 추정되는 연구를 진행하였다(Ji et al. 2008).
에티오피아에서는 T. turgidum subsp. Durum (4배체) 밀에서 가뭄스트레스에 관해서 유전적 다양성을 확인하고자 하였으며 이 과정에서 출수기를 포함하는 농업생장자료를 분석하여 유전적 변동계수 등을 통하여 듀럼밀 자원에 대하여 군집을 나누고 육종프로그램에 활용할 수 있도록 하였다(Dukamo et al. 2023).
칠레에서도 T. turgidum subsp. Durum (4배체) 밀에서 지중해성 기후인 환경에서 가뭄조건에서 수확량을 판별하는데 종실의 무게 및 출수시기, 등 농업적 형질과 연관되어 다양한 조합이 가능한 자원들이 발굴되었다(González-Ribot et al. 2017).
건조스트레스는 밀 생장에 영향을 미치는 매우 중요한 스트레스 중 하나로서 전 세계적으로 밀 핵심집단과 유전자원을 활용한 내건성 연구가 다양하게 진행중이다. Ahmed et al. (2022) 는 봄밀을 이용한 20개 국가에서 수집한 172개의 밀 핵심집단을 이용하여 21,450 SNP를 활용한 내건성에 대한 분석을 수행하였다. 이 과정을 통하여 10개의 내건성 유전자원과 9개의 내건성 특이적 TaDREB1 대립유전자를 선발하였다. 또한 323점의 겨울밀 핵심집단을 이용하여 수잉기와 등숙기 중기에 뿌리의 길이와 건물중에 대하여 GWAS 분석을 진행하였다(Bapela et al. 2022). 총 3개의 SALs (significantly associated loci)를 찾아냈으며 이를 FMA (favourable marker alleles)로 뿌리길이에 대해 활용할 수 있게 하였고 hub SALs는 Co-6A, Co-6B and Co-6D라는 것을 밝혀냈다(Li et al. 2019).
핵심집단 외에도 다양한 밀 유전자원을 이용한 내건성 연구가 진행되고 있다. 이란에서는 테헤란 대학교를 중심으로 이란 내에 다양한 지역과 기후에서 수집된 토착종 및 재배종을 포함한 298개의 밀 유전자원을 대상으로 가뭄 내성 지수를 조사하고 GWAS 분석을 통해 토착종에서 가뭄 조건에 반응하는 새로운 형질을 발굴하였다(Rabieyan et al. 2023). 또한 T. boeoticum (AA), A. tauschii (DD), T. durum (AABB), T. aestivum (AABBDD)를 포함하고있는 32개의 유전자원에 대하여 가뭄 내성의 유전적 잠재력을 평가하였다. 5가지의 가뭄 내성 지수를 측정하여 T2 (DD), Sabalan (AABB), Shabrang (AABB), Aria (AABB), Azar (AABBDD), Azadi (AABBDD)의 자원에서 높은 가뭄 저항성과 수확량을 보여주었으며 해당 유전자원은 계층 분석에서 같은 그룹에 속한다는 사실을 검정하였다(Khosravi et al. 2019). 또한 야생밀 근연종(WR, wild relatives)에 대한 내건성 연구를 위하여 Triticum과 Aegiops 종에 속하는 186점에 대하여 24개의 SSR 마커를 사용하여 유전적 다양성 및 군집 구조를 조사하였다(Pour-Aboughadareh et al. 2022). 이 과정에서 가뭄 처리시 dry matter, 항산화 효소 활성에 대하여 SSR마커와 연관성 분석을 진행하여 Aegilops 종에서 높은 수준의 유전적 다양성은 높았으며 연관성 분석에서 dry matter와 항산화 효소 발성과 관련된 8개, 9개의 SSR 마커를 발견하여 육종 프로그램에 활용하고 있다(Pour-Aboughadareh et al. 2022).
모로코에 위치한 국제건조지역농업연구센터(ICARDA)에서는 다양한 질소 수준과 경작 방식을 사용한 8개의 환경요인에 따라 3가지 germplasm type (Cultivar, CWR-derived, Elite)의 가뭄 내성을 평가하였으며 CWR-derived lines이 가뭄 환경에서도 우수한 곡물 수확량을 보였으며 유전자 다양성이 가장 높은 것으로 평가되었다(El Haddad et al. 2020).
이집트는 자국 자원 35개가 포함된 107개 국가의 2,097점(landraces 868점 포함)을 USDA에서 분양 받아 수분공급이 잘되는 지역과 수분공급에 문제가 되는 2개의 지역에서 총 2시즌 동안 가뭄 처리에 따른 표현형을 조사하였다. 이 연구를 통하여 가뭄에 강한 유전자원 선발과 이집트 내의 지리적인 요인에 따라 환경적으로 유리한 유전자원을 선택할 수 있는 정보를 제공를 활용할 수 있게 되었다(Morsy et al. 2021). 또한 듀럼밀 6자원, 보통밀 12자원에서 상대수분(RWC), 기공빈도(STF), 지엽면적(FLA), 엽록체 함량, 천립중, 수량 을 이용하여 SSR 마커를 이용하여 내건성에 대한 유전자형을 검정하는 연구를 진행하였다(El-Rawy & Hassan 2021).
이스라엘 연구진은 maker-assisted backcross program을 사용하여 emmer밀의 가뭄 저항성 관련 영역을 이스라엘 엘리트 듀럼밀과 빵밀에 도입하여 NIL 개발하였다(Merchuk-Ovant et al. 2016). 2년간의 가뭄 처리를 통해 emmer밀로부터 도입된 QTL중 듀럼밀에서 2개, 빵밀에서 1개의 QTL이 생산성과 가뭄 저항성을 향상시킬 수 있는 자원 임을 확인하였다(Merchuk-Ovant et al. 2016).
밀 유전자원은 유전적 다양성 덕분에 재배종이나 장려품종에게 부족한 내재해성이나 유용 유전자를 보유하고 있는 경우가 있으며 이를 육종에 활용할 수 있다. 대표적인 양적형질인 건조 스트레스는 밀 수량에 크게 영향을 미치며 다양한 유전자원에서 연구가 많이 되고 있다. 보통밀의 집단이나 핵심집단을 이용한 NAC, DREB, WRKY, ERF 전사인자(transcription factor)들이 발굴되었다(Du et al. 2022, Mao et al. 2022b, Mei et al. 2022, Yu et al. 2023). 내건성은 양적형질인 만큼 내건성에 반응하는 과정의 하부 유전자 보다는 건조 스트레스에 대응하기 위하여 가장 먼저 반응할 수 있는 전자 인자들이 내건성 유용유전자로 연관 분석을 통하여 발굴되는 것으로 사료된다. 내건성에 대하여 ABA 수용체 역할을 하는 PYR1/PYL/RCAR (PYLs), 큐티클 층 생합성에 관여하는 alkane biosynthesis gene ECERIFERUM1, WRKY 전사인사와 MPK 상호작용을 하는 VQ motif-containing protein 이 발굴 되었으며(He at el. 2022, Mao et al. 2022a, Zhang et al. 2023) 특히 후성유전적 변형 조절을 하여 H3K4me3 메틸화와 H4K4 탈메틸화를 발생시켜 내건성을 갖게 해주는 jumonji C (JmjC) domain-containing proteins에 대한 연구가 진행되었다(Wang et al. 2022). 중국 연구진은 야생 emmer 밀과 듀럼밀에서 각각 63개, 49개의 가뭄 저항성 연관된 expansin protein을 encoding하는 유전자를 발견하였으며 이것은 emmer밀의 expansin gene family를 처음으로 정리한 것이며 진화 과정에서 손실된 emmer의 expansin 유전자의 다양성을 제공하였으며 이는 밀 내건성 분자육종에 활용되고 있다(Li et al. 2023).
밀 유전자원을 이용한 열 스트레스에서의 유용유전자 발굴도 연구가 진행되고 있다. 호수의 겨울밀을 이용하여 25℃와 35℃처리를 통하여 열스프레스에 식물성장에 영향을 미치는 AP2/ERF Superfamily 유전자를 발굴하여 열저항성 밀 육종 프로그램에 이용하였다(Magar et al. 2022). 야생종인 T. turgidum과 T. aestivum을 이용하여 MIKC-type MADS-box 유전자를 발굴하였다(Schilling et al. 2019). 이 유전자는 건조와 열 스트레스에 반응하는 것으로 확인되었으며 밀이 환경적 다양성에 적응하는데 중요한 역할을 하는 것으로 추정되었다. 또한 미국의 워싱턴 주립대 연구진은 6배체 보통밀인 Chinese Spring과 2배체밀인 Triticum Urartu, Aegilops speltoides, Aegilops tauschii, 4배체인 Triticum turgidum subsp, durum을 분석하여 Heat shock protein 101인 Caseinolytic Protease B (CLPB) 유전자를 발굴하였다(Erdayani et al. 2020).
유전자원을 이용한 수발아 저항성 유전자의 발굴은 종자의 발아 능력과 휴면성으로 연관지어 연구가 진행되고 있다. Lui et al. (2023)은 종자 발아를 억제하고 휴면을 연장하는 ABA의 신호전달 과정을 조절하는 유전자인 Calcium-dependent protein kinases (CPKs)를 발굴해내었다. 중국 재배종을 이용해서는 VQ domain을 갖는 유전자 중 ABA와 상호 작용을 하여 종자 발아와 휴면을 조절하는 TaVQ protein을 발굴해 내었다(Cheng et al. 2022). 적립계 밀 종피색과 연관되어 수발아 저항성 유전자로 알려진 R2R3-MYB transcription factor (Myb10)의 경우는 IRTKAL/IRC motif 영역의 19 bp의 결실로 인하여 단백질이 변형되고 종자의 휴면이 조절되어 수발아 저항성을 갖는다고 알려져 있다(Zhu et al. 2023). TaNAC074, Sdr-A1, Vp-1B (Viviparous), MFT는 종자 휴면과 연관되는 유전자로서 중국 밀 핵심집단이나 재래종 및 유전자원 집단을 통하여 발굴되었다(Chang et al. 2010, Jiang et al. 2022, Yiwen et al. 2022, Zhang et al. 2017). 또한 식물 호르몬 생합성 경로를 조절하는 MAPK, MKK 도 207개의 이란 재래종 집단과 90개의 품종을 분석하여 수발아 저항성 유전자로 발굴되었다(Rabieyan et al. 2022). 이러한 내재해성 유전자들은 Table 2에 정리하였다.
작물 개량 과정에서 원하는 형질을 갖는 유전자원을 확보하고 그 성질을 이해하는 것은 육종가에게 이용 가능한 새로운 변이성을 육종 프로그램에 쉽게 도입할 수 있도록 도움을 준다. 양적으로 유전되는 주요 농업형질이나 종실 특성 등의 개선을 목표로 하는 육종 과정에서 광범위한 외래 수집 자원을 이용하는 것은 투입되는 예산과 인력을 고려하면 매우 비효율적이다. 따라서 지리적 기원의 유사성 또는 표현형의 유사성을 기반으로 자원을 통합하면 이러한 비효율성을 줄일 수 있다(Ferguson 2006). 유전 연구를 위한 유전자원의 선택은 많은 경우 유전자원 세트의 크기가 크고 자원 수집에 대한 적절한 정보가 부족하기 때문에 어려움을 겪게 된다. 또한 유전자원 수집은 종종 특정 자원은 과다하게 다른 자원은 너무 적게 수집하는 결과를 가져올 수도 있다. 핵심집단은 유전자원의 비교적 적은 수의 선발된 자원에서 자원 종류 간에 균형을 갖도록 만들어져야 하고 중복을 최소화하면서 전체 유전적 변이의 대부분을 대표할 수 있어야 한다(Brown 1995).
유전적 다양성의 보존과 활용은 기후변화, 새로운 소비자 요구 등 예측할 수 없는 여러 상황에 대응해야 하는 작물 육종에서 새로운 형질과 대립유전자의 원천으로 매우 중요하다. 현대 육종에서 반복적으로 사용되는 육종 계통과 품종에서는 이러한 변화에 대응할 수 있는 새로운 대립유전자의 발굴이 쉽지 않다. CIMMYT나 주요 국가들의 핵심집단은 보존 자원의 10~20% 범위에서 구축되었으며 종자은행에서 유전자원의 관리 효율성을 높일 뿐만 아니라 작물개량을 위한 육종 프로그램과 신규 유전자 발굴 등에 다양하게 적용되고 있다. 이러한 핵심집단은 유전자원의 지리적 기원과 그에 따른 다양성의 정도를 보여주며 자원의 종류별, 자원 수집 지역간 유전적 유사성에 대한 정보를 제공한다. 유전적 배경이 유사한 자원을 이용하는 것은 육종의 효율성을 높이는 중요한 요소이며 따라서 핵심집단의 유전적 다양성, 유전적 구조, 자원간 유사성에 대한 정보의 이용은 더 많은 변이 창출과 더불어 새로운 유전자 발굴의 기회를 넓힐 수 있다. 핵심집단 및 유전자원 집단을 이용하여 내재해성을 비롯한 다양한 형질에서 유전자원 및 유용 유전자를 선발하고 있는 연구가 진행되고 있다. 이러한 방법은 저항성과 감수성에서 단순 비교하던 연구에서 전체 유전집단에서 정확한 목적형질에 맞는 유전자를 찾을 수 있는 밀 육종연구로 활용되고 있다.
육종가에게 있어 핵심집단은 주로 개량할 형질의 유전적 구조를 파악하거나 관심 형질과 관련된 게놈 영역을 식별하기 위한 genome wide association study (GWAS)에 활용된다. 최근의 다양한high-throughput genotyping 방법을 핵심집단에 적용하면 보다 고해상도의 association mapping이 가능하며 따라서 더욱 정밀한 신규 유전자/QTLs 탐색이 가능해진다. 핵심집단의 유전적 다양성과 집단 구조는 이러한 신규 유전자/QTLs 검출을 위한 적절한 GWAS 통계 방법을 결정하는데도 매우 유용하다. 핵심집단의 활용성을 높이기 위해서는 유전형 분석보다는 오히려 유용한 농업형질에 대한 정밀한 표현형 정보를 대량 확보해야 하고 이들 정보의 표준화가 이루어져야 할 것이다. 환경변이, 연차변이 등이 반영된 농업형질의 표현형 정보가 축적된다면 유전형 정보와 연관분석을 통해 유전자 발굴, 클로닝, 마커개발, genomic selection, marker assisted selection, GWAS 등 여러 연구분야에 핵심집단이 더 활발하게 적용될 것이다. 보다 정교한 유전자 검출과 조절이 가능해지고 있는 디지털 육종의 시대에 핵심집단의 유전적 다양성과 표현형, 유전형 정보의 축적은 육종 연한의 단축과 형질 선발 효과의 극대화에 기여할 것이다.
작물 개량 과정에서는 원하는 형질을 갖는 유전자원을 확보하고 그 성질을 이해하는 것이 중요하며, 이는 육종 프로그램에 새로운 변이성을 도입하는 데 핵심적인 역할을 한다. 육종을 위한 유전자원의 선택은 어려운 과제이며, 지리적 유사성 또는 표현형 유사성을 기반으로 자원을 통합하여 효율성을 높일 수 있다.
핵심집단은 유전자원의 보존과 관리 효율을 높일 뿐만 아니라 자원의 다양성 정보를 제공하여 육종 연구에서 유용하게 활용된다. 유전적 다양성의 보존과 이용은 작물 육종에서 매우 중요한 위치를 차지하며, 기후변화를 비롯한 다양한 상황에 대응하기 위한 새로운 형질과 대립유전자를 제공할 수 있어 핵심집단의 중요성이 더욱 높아지고 있다.
최근의 유전체기술과 유전형 분석 기술의 발달과 함께 핵심집단의 이용 범위는 폭넓게 증가하고 있다. 개량할 형질의 유전적 구조를 파악하거나 관심 형질과 관련된 게놈 영역 식별을 위한 GWAS에 활용, 고해상도 association mapping을 통한 신규 유전자 및 QTL 탐색 등 보다 정교하고 세밀한 육종을 위한 기본 재료가 된다.
유전자원을 활용하여 여러 농업적 형질에 대한 유망자원과 유전자가 발굴되고 있다. 특히 조숙, 내건성, 품질 등을 기반으로 한 유용 자원 선발과 유용 유전자들은 국내 밀 육종 프로그램에서 활용이 가능한 특성으로 환경변이, 연차변이가 반영된 정밀한 표현형 정보의 축적과 표준화는 유전적 다양성 정보와 결합하여 육종연한의 단축과 형질 선발 효과의 극대화에 기여할 것이다.
본 연구는 산림청 산하 한국임업진흥원의 다부처 국가 생명연구 자원 선진화 사업(2021400C10-2325-CA02)의 지원으로 수행되었음.
Download Form