Skip to main navigation Skip to main content

Korean. J. Breed. Sci. : Korean Journal of Breeding Science

OPEN ACCESS
ABOUT
BROWSE ARTICLES
EDITORIAL POLICIES
FOR CONTRIBUTORS

Articles

Article

cacGMS: 특성평가 정보기반 식물 유전자원 군집 알고리즘

유동수*, 강만정, 노나영, 허온숙

cacGMS: An Algorithm Cluster Germplasm based on Categorical Genetic Traits

Korean Journal of Breeding Science 2022;54(1):16-24.
Published online: March 1, 2022

국립농업과학원 농업유전자원센터

National Agrobiodiversity Center, National Institute of Agricultural Sciences, RDA, Jeonju 54874, Republic of KoreaJFIFddDuckydqhttp://ns.adobe.com/xap/1.0/ Adobed     ! 1AQa"q 2#w8B36v7XRr$9bCt%u&Ws'(xy4T5fH  !1AQaq"2B Rbr#u67Ѳ3sTt5v8Sc$4ĂCÔ%UӅFV ?_Aנj- H>>,m*>fzp"TrKkr^r.|_&]|*vPuܶvoQ1mwVJUhu-I"=LniAƕ8"۲ k*ҿ[yu:.vUQ+)%F DHyVBk>Hy8jݹ q~9D4KRmzQ)^ʔ.J%k_tVi5NTjg!'ky|5asOȻ)R۸ߩFMԿ3L4j6dڜ#NIwUF]JqB/(FafJRzq3\G՛ ?~\ 6)6W4m[O^L0E&rRMض*C .]Unl-1 1r#Rj/&QɈ׉˩s6Rj=5Tg.y.·Pӡ:JJS:C8-2u]d&vUz;7p9 5VnL֢"y)">iי(IDDd| Yj0; LRfS:ktYK%*N2^m|&dğth":ey)uPQZW)gcC3Pv&MMWd&Ŵ۲mvTRoժM03*F3Yd6\8,\hݻ kߔi<k NTwSԪmljj[>->ptU%'LR>&EBH$MQAUx[$Z6vi&_a.KIQ{hyƒ j"JOC9eFҝfj;˚Ω<[3_m% lQ@4g=5$(J]Yc-OMq<Ǎ wSzڗ)k$7VIP붾ͯnV+卵*t]iЎD31~SA1éC2u)ʼnQn-Uoi3:grI8ؓWm*G zܕ)ZקJ}Y YlGeJ6cB2I NS3Q>k=KTBT]W6+SOXQgGR? telˊ%-Re\hѯ2TF"C/OJΩ6r[N.0{SpljjX1“jOsӥ;ҭhe}xu`Ք&.)yO̒ Fߑ.$Qw;9Iw2o+RVJMSOj[SoҌZ%;`d$blQ{Ro{Imڌ>3egf\O֝Uzx"䢸g+mv%Gʆ:|V[N'&ס-ޝ'kfE|K,G&˳98Juin/\\Qݿ̋v~Ǩ!rtWU d|E߫R4d}.qPw*Ӭv5YEcn~f5c%MTMkb-F>5JT,})QHg%{("ӔȸWMsYyWNRrkkJr0XドnͫT}r-jj,Ŕʍ\Q2Ri>v$5!]"JB2WɅ)]VԜUc8i|.jeRO6^V.¸ Q&#|ܶ-*uOG%JAtRZRr]FFG\۩w+?'zչSѧt jz>KW&ot{7P&2D;&\\>Q2JzܗAKSfeNn[jRrԕf6,q,F1tRfԗ>vֶևj-&R'Zi2=xv~Elbsvm8=ӛ"ū񕜈BȩlWau[]ٷBߨF~J!|Ipr3R̴#Yp)={7:G{+:\W}n|Q#%)7^-h"Ƒq:M*%J&$T軨I333׎g_- ucBwwjp[6i25$̏bU’ٱRv?G\~#Iͪb7<<}Ezt" q_Inw,7-d,G÷%T* Wg1"䥱kq/A.,_KhqŒxwvo u2ۥۧ.bQ}XκA$֣ +K״ZUNmڸII{.v{5z5ѮRme[moyƾd~cRݾK'j.\i&/S6f|b=5: p!6i_ 4j6=.si˧eƾtS^c.Y^RJVS-Vi3,esi08?H$GvZgg?gi䤟2adw릿:"۪lkSN>q-4kI܋ێe̊qۅgDoѨ9; #T.Q;7#~_Ufstb_'w~Xw1Xk,vcOt._}v}8"(4Z\ۘgk?J?bm_c!g{HZV]Fkk%~gEt)b秴vΰB|꽸}mp~E6ݹv;7P٤v+ri*3Ԣ|'O14_~7nP{7ZU\Vű[ +7󖱅o#:ǥŬ\|3r%TJX]V7ez¨Y]lc|O3V! R zbJ'PnGqVJ"19WVeOF埜EaEJωqCN5Z g-9[S<$sUK5b|7sn\7x qmv##FF\ w[=-43$^ooVSiXօv7iB۴yg>]Vf"r$J3""32!Zh[K%7GvNLs+4nB/B{vlsobJaҺJR:0g%&zR\ S3T[&ִor*ⷳc3ʊO[iozW٨%$gn:ܶWwFBԹjHP&z u&F2\f;ipW73 [; '_̽b;vib!oec dC-tS__$Xs]l9&z$2/N>%'[}b{h/{`{Ji׉׏ YJB/X%}.|+{(S:qz]4_Kѵo`^tY_4S#* ^zvݾMr+TrkQ g.8Ͽ^i>ӈǙvix>$o( ^qt*&t1oJVu-ql5U6jCЉmĻ*"?JT=K'O/|=Vo}l0b}}f?X[?/\JSBe,kP8ETJ==?.p5ފgbU9}ǶdNKk—_$8̸͓ۍ8Di\BԿ-1v{FF]|.^ۅ{vl12׏z7-R7wE?\nh\jN/Kձr_oBw"N QMBZqe-m:ӨSn6j4%!hQ;sv'm4kcM=!8\m[M4{SMliۇ%eֽR&N:{2A8)THLK3Zj[jPBx#BگMf:G1\`edcʮ?|w(-̮vXt,bW2;.ιNHRR#YwTM"<;mk\.foIDjmlJ;vxy7o7i\,KQŊ9d^Mmgc L*.T6tLeIuOH3SJQ3=F/ʿ<9\JM6mN6=<{xkP!F1QR[I$6ُimXu2An2yԒMU q f[IB-'䤯jYm52&JG\zд\~vdg QtHGXw&1Lw+nDEdC1w|YJmvP)HZ>i0BPβә?R:QO["]I_Jʏۍ>QKyu^bycBq4lXF~l [\*N>-J6,Gq(Zr5h]CwYӤU~ʶߑ u*SIv%ZfJ7)! FS*s_\|IŸZ)J ]ܜi4"z[+Z,MOZ))}|Ʀ(RUNIII.S'ˍO~˨rn}M)xxӕ0 eyҵ7YMAB]ӣU:/ѭ*6bcwP͵ "+qēVjŹO|GtY4V j[mLV M -m>",B$ GD1~j6O4|LxnNmqATNR3ε|DŽa[fmn-ڭ+FiK7Pcm;r5 l8r{#-]'nrFh2ruycb;pW=njRqRJ(d mnpckNnʹ+6]tz~E=ʕ l ZZ5jSi3#47.Lcfe`9؏v囜.F\-UZ:*0_<Νu9Lӵm&)_3\^ҹ3"1n1v_|uRʞͫr'iȧN_kH׺8xXrj=\МH)V\ˬ.Xʸ oVRC}ySU9/OBY먌5 ٿwޞ)rw8Ӫi5*5ZΗcGƱ !ZۄlmpjJ -l <R̵/JAպZuq\IdUS 48wXJJtcg4cI~aqߓwŷrm-v)G7yS^7H^-\mŌAq|"m9IBnF㏉9[N+mmy/!KKۉ%n +BdddfFF6FQRN-U5;Sv'm4kcM=Mn)\qιqUd9F%",6MGdT%-+~ f%+y֛^3SrF>6lc(֪vۊN;g._0Sѧ]ETWرkQKzGe9ʨsKA"yC y2\[5 rԭ7Gk5Mzw_4sM3hxЊ'oÍ5jsub )ͪ~tR2H]R͍>̋m6=%(˿(Wrr-܅y5(ܔJ޺YunW̹븹NsqK ]/QR#"ZMDfD|43Qw|._ԡSqTZBg??O Ϥ)/E_U|i}2 9Z?¹0:x'3,whǣ?C y-A~=daJј&M?D1_PS+Oi&;a @;Dž7[ zZC"bv:jjMQk$M RԸ3uA\=wI.AwC"^.{?-\NSiˏ"b}T/}q/ o.1M}R%:-ZniʒL$SgrBW*,Mw'N\ɇ{s\j]VryG'8f`}'N<*/`U숻z CwHq18J+vԕKss4R53/&XTt1bZƟo\=%nO)h$rBi-nKĪ^ ջڜlwkYm[̑+/QrZo%TQ;TLs($2C:s.%+eoNttq۰kK7O0m_t_pZ1SsSM7"mevFZ[w -FJ*T*jФQRg BSu|]g:ɵzjqwmltL.e3sRMچkSmjkmWœިm++¦'tILk*բQ D,PB\lI[9{%Gb R6öۍmX-MaʉA931cs..G4CujQտ[9 }G-xwl)IQz j Ó"rqe&=]꾧֎c)<kӳ+0JrRR3'TnXi^xMF Bު*tIL.[h"2"nKzZe'ZV/RrNYz]8죝n]Ķܩ>^Ժ]u-7^\mZjܣ9+Rmn ߑv?oꋘ?&ƪy^N4o=3-ؔ̿*`}V݁ ƒPu8%$ ݗ]wt;\y\>='OjPIp/nJU8{϶FNMsf"ίNqƹ(+ ݮF2Km |jܴZs%zf*eȫ?]4)I۵nR&FX + [jDh(#哑9q9Eծj8noǕZf\J-l&Z˫}`ӎhyrΉn\űn]9pʌӣ"׮Wt?N4_I_~54#/my1Xr*척aS#DT >q ssΛW;3oUaJSRMDgQnt:Ql,/ ܷfRqiM Ȼ>Cob;A>ڦWقM9X~/!'MW.}Vrߔꔵ!5|iB(0-zF=}okڢE$^wW~nokY߮\6՜̌{i-AF*9)\t9IV6۸5ZUF6R$ŨQIq砳YUZ]eyv >hI櫥N )&l JulwE1GDOuFN2| }馥uC1rޫV+^gdb&W[4<^e4YW,d|htͮsUM)۸8:{3d{AѢ)~ \#J=NdƮꮓ90 |1K$v*?мS ]i$J,C,SG?/_՜pMSƯM|mG1V1$~K>CSvkuj=&) -,yLjuFHK{c駗.SOua;BrSqj-ۍZ#'Jys7[g2z/.u4+XV2VQ.ޕ)$"(%)#Z7suZ%j }BǬݕe)Jvz8zJf:hIN|svO1O#IEcۍjݽ:SdὮvu^@:o^5cs>i/VqmVm]ؔܢn6'vޑ̗J4Wn@OlKbX ;n:hgJ9ŻyǑz8f܌q&Y fN0N;[69 rbׅC2/#kE l&2~èMR.*%g=Ft.%؝e8<.e=Uv{~㻏"EˑnvDѭ͜Lu3u0:U֝$[M5<:oi+V4V9 6nXvx&_ q Qqw3W:uϔ2yb/(ɳ|5zQiJ#r|Hw#.W?4aDŲ\ugWG;Cw鐢K|xg)##=O.dF˟jMUvWĻsr.z]kPc9"]R)mkfOd*uYf١RsB Aîh=k]ʳUrrZsq`d#r$/Ը3o^&lRWȍyuW̦Y4QDUMJ65ƒ[+ygk XK_±k#y:8(TJOSQhJt2.DR}"5[) r)6V6u5k:eXZmv𭤔!푊Q[qQ}ҹLE- 8qIZG|UM4j}Mܕ[Vwm{} Naqµ"ԈM zOpKѰ?IAD3Ir0'/q1itoB5{%wkOBn-ۜduqIzYK60{+DʕܞqIt";r1mG/\/ym[6JƫR \L=S=OT@Ix[TMm{>ݾտ֒ݸӉLYIx>+"JVNzx||5rI?C{oz8۹e\R-^\A2F R+N9 vlT]"ۭ d)t֞i #E2jB@׵=#/N+!ĕhx}I!cM`ąZ*ŻɄҒ߮Y.Z}='/oۙ3IpW̮hT7cTSuz9>B}΄&h!>lӵn~j˅IvU.'v'CSZw8QK3G> ,J59ٷ+HSg䧎hJdzvwv-cvxS5[̊n~ؿ%ַX?O0\6ne 6kn9.ϯ} *h 8_QhLݣ7q +=XBҲ5?[[)+F`=4 }B,sNg==u*Nj9k_GJ)+R~GSPBȒZ:(K]heL=vKPӢwq(NrG^ثϣ?#tC?.ͼ[ۅo؞y#%ǛjVyLSw%T*s92JTM%"YkQО.q)gCͲn8cgi6j1MѾ[{9h^vƘǚםidfi.^RHmg&rׇz:}݃}xT$ضk'5s-狶,\vpbPD،=Okf.c#cdz2FK5T!&)|ntD<+OŹU i-G[EE*FDfeaf2QƤM\UG_{ǹm%\yrGy:.\4wjPGUJޕUV7Do\7Vy_13w;[?c]H\$IJ,*L]3b%L{y.JRKG2sq,B6T}(#nW|km+q5] r㪍bJ@y{byz,b踊3ϻJ,'^xd،)JVw#.Vټc''ÝպWtbRؒJz۠8!o9IۄS95E9ؔ-e9JR{dmnッ<[~n${~Њ$W?&ՐY_? #a.ߑv?oꋘ?&ơ|y^N4o=3t=~7!/M3>n8W홎2M`Qx+ z qy8%]7_~540ۦ彷]Wq CѡwkďyF5Dum_}~P(5.(X,K9vᯐ?leB9;Jhm#3{CxGE-S{;@Fz˙]=O'!ɿ]' r`:7'2bЖ>Iy,/eTy/V<.H?UYY{\^#ѣr9^7?xoRȆ7EoS_&??zϾM?(~Q-K&>"~aߨ t7Emsϛ+?;fCr)fY+>z$tIkjn_>vnrֳki-˹l= t;'EyC¥|/BLwBJdgjۛ$s S1|ɍV%JI6KvəhzIlBYɒ|0"Sy0F>eo5W)O+X˻u';v)2vVq۳kۮws?UʑBǴYO漪e2MIjPAک\b1)DDؚKm6ZWΨgȕ۶yjڳ 2ضN[C[|r@9Jfo<_eI7q.|cÊV߷:i.:$ȋ)1%%)ADZCEBxJ0MJۥy(bNsKM9k43IwNt.\%N簤I'.j|ƃ2$grBEٌ\}9:v*!n7M(ɽ]7c@XxƱԨ37īf62cTTfFK]9wntQHͮvٱI/f|j=7}\_V5U^+:uljSȃY(XI.ȱmo1甅jڎIZ2>#\*:gY|4k\8ZwSqtyA!+];бޞKծË¥e)#5ap.QK^8VdU{*ѽL\=qmjnB5>{ Ӟ`v±5 ^k&O~Oshɷ,;6nOW>u6{RqS`)S%jp\ipdEBLfTWy$GIYw~䲭J.1vSY5z.V>^+Ǎvc.I[R{QsNR3ӎfhd>y?UJ*}~[e\i5U^͛E]G_FS(Iɿ]i8:4zj~շsW,ˆsy:%O}iur]iF5~3M:Ӟ#N06)4ߧgdawIotiz:1r5YDZLHBSi;NQc44la=Y kQIT*ըl:tq2(է9VO4뒳܂~2rq'nrVZŦ[t7\oլfb/mlpc.I8콚q^1iE~䰳mi[dۧw֤ICfdFeCsg:i| 6擣׋* 96lust^{%99UNRvaMܽo ammi$em4D6DD\nA%$$#}۷/ݕr99JMն[oT޲E"KTaP+HGkŴj5TM5xƱOS-k`ۛkٝWz;{kS}F;~q|~^_|euwnE'pSupUP)V]vE+t =ZRaVdG6= *.ϼnj9:UɷbېmF_tޫgHjVS'śǕًdkkѻ_]Kv?nT>)^e=Ar1'3ԔILyD?:-^in):{7.؂\.:V }#뺾.3r̸*xbFM aȵz 6SQ:ײj[ 8nn iFMw rR"5M5I旘35f^j='j:nNW.ʭocZvZKV^ɚJ.cM1ZI7E'6rg탸5oZ=[m Z`\hbMUR١Ȗĉ):Jin!_7Dй+f̷eKҷvͨBPR(V`y6tw*MRΝcB.ڭTnc;P$8nFvm4(D(R#R-L -2:FP lxZKQc6I("Km%$E, 78uXIFA$RQI$JbInG]c[ֹ:ZM+n^')JmJMJRu{e)7jQDw~%yQl}BZujSSf۩QZ+Dzhd5o%BIc'GZ?}΍:>Ɵivז-%݌J5MqGWTVʦh݇ܟ~Օ_6 n'{3~mϬj'J11OȻn߃r Qr\3y٘+WӍ'WxEs^O3 o~[|7>]]H9݇ZomT@]?5B:Z߂'`V_+/MSKX߆ޠk3?o7y:4R/7þ] iG߬aBRU&?r&/} cQߥGj2?C5Yśe7hU=?+ x龳f-܈czW^7p%-(\D4h{UK&ӡn^m]Fݢ:`δvj俜F+) y[{{ 7 tu>gvrěOj'5 iRg[ͶFjGe n~qT$ci ۚ0oԹc*jL[sVWqj\ݻ&6"WoK:cnWmrv)o>66(F>=W^bf#c zzʞtپy%mՉPël e}J.\Zk4ttt>oEM=q)hJjI=ͥ(%]脼_88ф;͛gWG;Cw~˘$4=uWdĜTثNDkiQL9U*O"4XP`02,Ge-k5$h>ܼ]3vr6!9RQPIVSnM(ۓ{>;/Qͱv{3&-[rc)ܚI$n{Sv3[j00)-D3z}MRzVQпj,T[uVs0\}Sid;r(ݝJ>æʺL&c[jPK0~d(FKÝW\m]GTcF|Iׁ)I3~#oX%vҦEݑؼ5Żv2qAZTE^..M{ʐfȏ2##.R}*KʛZz^ӞN*lPťLf\G6[WVQquV]XAi)5J!,$iJ6o$tPZc;Kjx_n3`qIelV~vLy{fn匋Ѿn%;zV.n'-ұdd2߽1bZksPe3TI9)$ԩIN9Vơ\=2885N\ p)/a柛w9g_lױo8ݷ iixJV& ғRi{N^_oAŮE6Y7I$Nk$|Q)-*4Z)^¸%4Qm [I%.c-OV+C֧R#%ѨCe3i;w$G+_dy| Fzj$DI(=OA gj%v/]8qԯNIS*֩',Q%\44ZZ%D|Ǧʴ6&vֵI$%8(ԬƾS&#Z. }6z?b/|Jl{ץv&mpx4Z$”ڝ4-H%dGKfM:sKSRWeJAn]>s6应-W9'H]'uȫYvgK^\czp|My\鏩w/ËQ.)]\QiS`8uL뚛̸=J"ܻi\å'-)54Ue]:K\퓡vK xwBqrH\*֕TnzC.mT=t-H]SČ~Nu╏NÅ3f|͡G~B+Xm[Q7U{9"~jgK Zoʰ7"qJ,ekSeNGgϳ] ^.6:s}_,%eRg<5⿨z{ZPun#jRІ.6g T.!]xa c#jN$Zpl̋H WZu8WmMRýsĮ?Mco~sx TU҆Q :KDG4n42.<3/'^?6/ܠڒ^yrrÿr2\D}}B]^E~^T cɛ7϶Y[<֞[7d}2%QPqOLEQR\CIsj1?\}%tJ0e~ *sk"*)&ۓEi#{1J8Hrt|'ܝRr8)=ƔN'RVz:cf]F7bZyZUȘ4x8,#JG̒?.W9XnO]KO]%]ƻ O5Γ/3qÓj؍/r̺rƵ 5\&m6h.xoeX[=<3%< lZ"2h\Z[&jW3ejm?k&[]ųj+{N{66leu_+lj]q* 7g*knأYv= q ەdxЬZ|%GUrQ3jLŒqET]1% qkXYūYc[7Ś]QY\jko\</Lc7+'hMSUc6qXyؙ~6#ѯv.0$BQi5YyIhɍiy=KD!n3Vm[V%W-B%swa97ajۗ m+9~]fKq|Ddaˑ0A]_v޺mM5* F-BYHJ5}q>ʉ.6hyDmpD׬'-_v5;5[8K[viJ.3dR:oYHHh9I7:۽fi+wm^ [)odPѱ52CZUJicSw\&_s0uBȍh32džzQflcd^m|7GѹE!fO5]]H9݇ZomT@]?5B:Z߂'`V_+/MSKX߆ޠk3?o7y:4R/7þ] iG߬aBRU&?r&/} cQߥGj2?C5Yśe7hU=?+ x龳f-܈czW^7p%5|Y:SJE\U-(a_cƣUǽXXKiȞNlmۊڭڄR!**ܤMeȽ$|X5(Ź\rJ~ܮ]>'HB0cp XFr_c?f?7<ukSgov¥iG>>䙗i.+t+bOjIܶ . i^:nm}s}(3>NZ$2Qg([".>i.ƾ)B̋M8+"- >eE6DݥJnJˣt׻ 5.˅nJGwZD~!i۶a,Db3ZQ3O#KO5/֍ozuK'GbRi᝘NV_ҝcvם ZoX}F6z 7e5_e:ۓj=AB+iܔERadMBq*ԯ DwI/Gy*mĥiRKg6skY/#SN4e$-yXM YL?^ĸNNӪ{$r1JJRSLO]Aqm>V/s[~i/j+m>z}eI"Qvp]{ZԼ:{vPAG2=T͡@ڐ#u"E*>C;o$~C#_d/HBq^YRٽzIKbOm\~żjFFGdiQ(*/i*#.FF]©m=BmpQQQSP&Ҫ!T&^>:y)$ˑÐFčI Bӡ-t!bM WҦŶ'UZ=}zvn~oT/\ǒ'nr8 AJIӆz<^uߖ4eFC1i+v!3qNyߕni?4JZlmYFXFۼO0B\m[ tʄU3s"Sr(NJ;SKW72L4̏BVdf^Ҹj\]ȱ۪(ӷm?J-KEmWڽ^4<8qu%9pŹW~877ܾeVгS(յe^C]yX͹! םm4FGȋ\y'Z FX7e)|Gjt߹#gb\ŧq_([R8[qU$Z (ʻezV2V!iQ,i$JE˂٩ a(GK'O{vnBvryRd-RK4=qxZJMl_CuuIz @Rt㮽޳!|68\-l[џ84-2Pu" RJ_^OL>G1~XnBŬw6J0*Uvlږ1N G1q9IUm*'oWu][&UyYZbBZRZNfEJf"+2nF~Eû7n1xv.RUM$6 lAxSQJ&n5ܞwlEói"#>4׿Q.nEq7Oko[1wg8ZQwZYiqtm&~">Bo?w͡ni2峋NCEy Ҕ+%ZJ ʩq*fpˤl,~^Mχk1+:ݕ z&Y`KLӪУDr3[*Z :(SL&ݻ۬Vqsyԭs x|iI߽zZrg.:mp%6ԜvgmpIUt;QbS.Է) ǨKSV,*lڌ|5Jt3#NP.=+OZ~/G سIgbꥹJnl_DUM\iM!֔wVZuԺ,yV.Q>f v:݇WiaŸN5Ҕ[M7SsrvǣrMW= \8ZW-jsnڕ.ZnF2qt ً[ٻޘY۷Zm"Jxr&NAfA-݌to9s359݆mZ+N1-qS$D=17 x׵+%_ ve4ir6Z$FDڗnFtOr'7'{9C˨ꤡaYoace{Refnft RR"4%ʌm:Sj3)OdInTO>X'vxV#jܮw9Fog;5.~Y5\~18YQܹvj4+~t7S ﬕs %^۵ڴDZV69R^Y+rj$ԇoJKR5wB9C>Y:l+EǎS{ʲ{T6Wi* ^^9k/y/Cs\g*qڵgn4T8mERr|Ti+iPe;;.i\EBEJ 丬i9ɧM-ԼsGDrZ>r#R>~X9y4b棇9JwV۔%m(b[Tjvl}۩~nDԺ{Zo-YuK1vx.nWuO+jN [ٮ0%"΢CdTJK-RަH"$I(*ve &҉FzB,_Vpqp9m8werv')E;o&QE׵^d9˦j\_,ڵugZȻ̧8k+jK{wmr@3ӭ2 wFkzFVqs1؛.v'I%$[iT]D5Dl2 nk7qUxԫLS+sا3/ΖeZYK<["%-g/kRs:f3;*E ت wJ%)5&+&rw*霣i|sMҴ|;R+fm䡩.!**dӶ-6s6,]zAXMWjmnz%SJߴm2UXw7MQ%<!tKys#P,W>s;3IYwx<+i_\\\U6 u7P|xbn_k&ӓVOe䦒 VUr,-㘘"-LZeOSҠթrEvq8Kf%5%&K"#%vD/.ZYYŏ+p$nZkvއuW9㓱Z G wYIFyf)?ƎUm5ԉ/'k84{KO:rQI}XRuԪ|*lu)3qZ[mSm5R3".Xcَ5c®ࢫI*۳~wRϿQWޝ(EJrri&ۥ^ʶ齲Im|[yb;mnm֩uiܘq>E+Ikx߄3r33-5𹻖09ϖ9[Tz~mr5NsWl$oPusޛ^{Z;);sڹf\3oٹZmԉ/'k84{NO:rQIBø8Bݱ3n֤DiK4u& ofSȒܩx<˘|N0Fչ]qsp"}! QWw@t4ӭ+cO5%]'*{eM߲DRO1y*q8w++e!c߶ܪlZWّM欼 CQ̼빶lX{vib/V/ ai;x6~]+z]MWB>re-:lgk}պ!#9?%܋V-c[z!W?c7YNm/jRr[HOzԻefճ0q15Zp#rkQQ0tU-AmڵP/cȕ?0cZYj;:0ZM=D6g ?'UN+ձ[K ܖB2'xq9{|۫N0ku 7xaj;n\ 2[VznMlWiKbSk))f..)Km)&bGZ=>OR܍W:j'rM'wYz&/鶧{Sʵb"vջq[I-ՌZH._x*BagC'T(Q:$ͳQcMCKy?3g'ߝqnT);qs #ؤZ}OOI:cfnc8W~qy.;^pVl]Hԓ>^H^@7-AA܃nmL(uWܻS߿ Td95Bdh4t6*dDh!EhI[iŨ\L.&Nc ܮf^;$R)\rip9I|ٺ?#R.ZDZ;/]nݻqs\QE9M&Bd ]N mN*D>tgbK>+ˏ.!23]BȔR1ɝ^j'k2ƮqBQq[$di]icV/e`޵B.FIIJqbi>Ӥ|p; 6${)RU>_e}^dzdfzi %ekRVUS?6'hׂ)5.\+qUgzE2C˷ecŏ^֔ibk shesFWJ#~> Wk~ݨ}ڶ>ơǚ)׽ZƉo~B-ڼrvoE:Ʃ3ۣK7+Y`WirS):{>ڛ}:wԨ(J_";6R%[u&ƫdZ_\'np| RJwNeTW,=rrbnkڄ[M3ܴz)3- R.?:okۼ0TU'w{6&w7j1z3ON'fGoO?)S_bQ_¿R(^ԴԴG.EtMڇ&RUiW uQjU> Kiu1d<ѥIQ'RQ1:O/lŗᏩiʂv&Jc{D5 Tt)1.n[n۶X}RjqnOʽ(~[Ns{ސ⛌uO,kgo֢dRNQȄ .'6W!׌P朼tdZjFGE"]K@'i۪N;sI[{SOzk>`rRR+!σj8&TjlvA̷Q?HyjyLHNտJMjܶT۽lG?SnKN%<‘ nq[N0Sq[Ta(&t(|HGO~gvkݻTR4&Z$#ViOY1r$6YF?e4U/Mvxų:zbU^gQQ+NW_'4jfz^c'#`rvrڡ(IJ/J ݦ6 ]-CW |_{v*_q3^DZ}Ic6Uڌ8p7{crZq5ki`)mU6|-Z5^iEz3P=:Cu7DF'k%}<C-޹ֲ̱#\,(f88%X-N(ck0VLR~} G"-8ӏ/ϰKq?(#nrVTmZ;zióM4 m |UT'C^_1X.gXM{%ʤd 4\ovN":"y-,T)fLQgۢr=/CƹǨJVr[a+!rT|%Y\ٱzsS>jͱ.oOc6f$q% ǒGo;n[];ߎjrk{~\VۓNIGn:iqxo |~t5)Rxעri{Vi&NUOl_ѮMfsޕkЄay.0P{7N((BaIP$ K"U6Gl ݙqJRu+qN$ m#*p<|{:>-Ev=86N*MM긭U*uѾ?/^o7;'u,h4݌xښRM:5.(/ \իU.{F^rmF-Jɷ.>Q"[4xT^OZ~mK}T0ݛ^SAo9u?lX(' qj%=X}"^e4wˠ|rܫ 6I\Ķ;Ӻw!'ڍWg{ i U_9Avhۣƾ+:vs/MK[ɭīe{`Zgb}r[i'GE2J7Nez579wRq+Un ]J.cJ4M:h箽Wxxm^ pc\wcN%'My $$| :$Fqɏ¾^қP9J6Wxvu}ݵP>Z'FFdg"-; [¢cmWkÎT8nG%ݣ7*\խCLRYZͤiD&J#'ehbSyXK|y*ӞpS̍R`[pTr/Eg)K+92{_ n3zwz'oŸۤ+sOj J:`T>Cf*lwd\fYOP"R E֢̔L4ɥ :;.b(B02rJ蠟9>V'9M%)IqnhP<%,r'P/vNSwr#w"ݨaqc(|{kd=^0jTMR2ULNz|.<|^PfY22##!,K~E BEJۜ&jRNsHަޛg\r,v؜.jK3)[EJ2ii{KEiHP^&]Gn8x=K}Wx/KI9-ϵwQ%spܾ[^R}S3$qvq8M[ ozKxcqmJ/ӿ{_}7&ݨ\f6ZSyQz& 7ۉ[8~UNn|nkiTB+4RI8'Nc%tn{!]Ȋo.nEmʱn𵵥J A+wy#+ikǒڂ;՛s85'KmE:Ђu""Iģ5p=БbTY-ͽڔ詻ngL2Q}$de# fs^o{DUUsfwӶ;s1T,ǤtޒQ\෼J=.tKU,7čJ5 N$y3kdSMQU~mO[03 $zAڟsF5^뜞"Կ QHmrR"ӳηer+ҔZ]hE-6Jmt'ޒ=O[sQj)6K}?e4v_KfZheޓ=BV[bY}lݒTTЬ{ȫvO_qpRApVŗ 6ju=*BR)g "O1yhb=tqJ gtm\b3RY+JQ^Ō֍\յ\>+uSi{=x ^w;uӘ#ĸzLn*$anok߷CBӷ}5Yqvdž<( "_OWit5:EZj2 B ρ1̊fi[n!HQF82q1牙nqnEpT(2RMoM4ϳOu ':֧_Xjsg jP^(ڙ{2%E͖j^}ZU[Q$'U) <܂%!s"m R'G5M0<+zM6qYm$ڕ$3ǧH]?o2N<8F1̻r_my[Rf59NjpzBnl7*{.QP 3N&^BLJPjAHCK2Q}$#~YMq8 k(MFMU)8MEqTy+Tʞ-ar5yܕOXw!e;q-Jqܶ䓊Y:LC UE{/t>r"lI9)3KJjϤA 6SEE$d߇3KG*En|P\ԭTn6I-ƍKTj<1H_zwGr19wF N8ݝ+a9ɫM6mhePi%mmD! """"""*1bRKrD"vnrM۫mmĽm]ӡiG~e"˩ lhRTMk^MX["Jݱk7_ޕ*DqĒ&flՒ}`W}~SմZ{ĕ~wm*/{{ѹ_-0ط#P]xlڱ~Tn5wi*lڪ (JxioϏbqKYR|!|KN53 OS222$jzww%i}>N)E+rۥ7c$Ofl/LNث\6H9: FY󡈾I)fB֔JI_ ֣^: 9mY{66㒢7Uj]:.-os[R&gMF3˸#໹kmjq^8W"PΦURjʄWa˧T!͋ lW48JB2ko+ /Nw QwQzQ ے%$ޓ7^YL|r7!v%Trܥ &|M8~ybrn[RV gSn{{*#2#ԽᢏӴHak" ӌcwҜw&RJ07ױ>Ļ =^ BɆ)v32.M1=#6%̠tҤnzqMwԣ~s*%-j|_m*.Yx9Sz=)qE4 3pk+,`=kNRڥ=B=nŔNAx)Q$ԩȧ4z3t#Z2lҮYn$S%y- JzGpu|LBV7ZW#;Wwipܷ%(6jFG5#{$D"uۭ~]֫SrD܃fҎӾ+Tu>-ZTQ& N|$沸ii>eRWݳu'[O̻j8JۻEѩ[]vni= ڒ,[_%kC7I3Nv$4ɎЈeٸoUu:[}Do5|zNq=Tre%ɧ6&~DȍF]ƞG5q m]/w/ \ʲr8=oʔe9U(W"|S]uZd#?Se[W"ֿh][-7Nu:T=)R}.;ml*5Dlf $fF(̏T hiIUU4Szɕ t(%_|2 ~6eM;TƗK[f&]LK^CE2[ȏBOd;Mi|cx,^6;sیGpQ\NuJIFTJ~đArh* B"$H쉩eXPRj?sl"ԥ)su]xpԴY%VESH"ЋJǰ K&5^Ukzׄ8kEgS2h&Se\ Yl]WҶp-ZUvi7QS:4byqOo+[̺腋[6-_Fo.6[7$p&^ _GZԸߍkc.qqoI[9m߸YxOZЦ1uoiSH)P9Uʄjcq= S>֙NeR><;+ڌk%_qT].srNO?s[=vH[]RZHRMtᩗVؾ:/~u)ԍdg%=edVrISb{6vSu=(ܥ)mTv/J}̇8 S3ad:^hBSf؉OɔLhI_1d8,L><_A0y3rXq"'(۱;mFNII.v5_(^q~X>y{3צ I*Vܛv/jW' T'NR'j%ꔩ:mJ3SB}΋!-H-RJBТQoedi9tjENenPpke.%4]#{:>mkEɱdYWl\\\'nRM4&U>?Ќˉk÷!𴪛]]5}UqG~ݏI"O~s6(Ļ)qO~h}uԕd}Q~G,oE!&G&/]_H-O=o{k\̭bkv.Ô܈+;arZx)m?M\3lU$mk-CFXjTv6u' g:Vn_*qk:VC A%'4JV%EY)#BғO4<e׿jQQ]yUr4=wm[K1r׵%Iũ-O}|kC;/VcݩWZ)EHdžTru]8hgĵ-;=>U_ InvTm_jBM+QiF"9*{DI/iuo(=TzϖmPQl_v4z>T*ȴ>YF;ε\t]EH4ꌇ[VrLzef 2T^V>g2~kg5~Nק;{~Z~W}&ŒBӿS2$J?~(Yœ"˲ߩ\O]: J׉ښT{mmIѩn3˧)4LdFZ/zUG>U> n 5& ϴ-KJi2o]uKljvK3$bԔҚV旧iY5.ίfi96v7!v))FJM4{jG~Jt/lUE%pTAFe4qQk\ve۽/u/Im+W')v{\-E|Pms7߮DZRr۞/mu*1ՙaB܆ -xg3#6ۥtRogʌU)׎]ZҞNnŞr}F1Nnޞ;cZ{N}ۿMiuxʉ*3qi'9KHQ$WJxXyرŔe~[v5~/jN9Q4o6rJv FrdxM*iRjMzUinHdн7ᾞS=S'7 } ̽zt7K|_g J=Lq+/Bw_\ۧx\HJUPzQ<hqF[V0x==CsU7q|^ {)Iq38$_A(VgcKu06Ƅ"%i~_ˉk QCܣB8Ku/񋇵u([w}$F|8TՠI.E !;RJ^}MɒD_q2];Ɖ{5}*n7nEInO{Mwv}&q+v [V}Ĝ@%>#dXQ$f;iep.GquixVt x6bj͵mlKقQ[T]zs/&yەnM'W}!Fp_d^Tu N{ɻ'l{խ2.sTu{W^H&;1s)Pӛ6>$mě;Łnj= fLT)>׸+qReɴ[UR\L*P/!$Ӊ3Q 'K=m~6XqW3^W+ųO_[F$rR*u"T%@O +%# ]˽!aܽz{ͷvQh쩎]hGތ5ɇ*DzJDRNLi 4:{~2FmXY-zzĽ^f=]uū{/+&c:Ma{ĝDp2m܍kHș/(--m_vݮK(V{R}.k&yƴ7i^4@3f sK3^Ř˸B=]?gt5KbZB<e;kQLpxuWC}n 5ҴepB##~q= `x]KWF {GfŲ}?G.I9pjWkU]>={7q{kO/^I3==f1ɏ%nnʫ/Zu_yXN<57ۍ'vy/"8넭M2eԷ&Y,в33%IkjMr7xf nmQkX4踼>a-GcIeތw&U=-:qnW)z¥j :WqSZvԒ#j"KrIU)%qrmRoDGQ~SYRsu*V)  ,/x)MFD6O#]z 96[Ui(JRfw'y$GeUީkdMF-ݻ98F2d[o{Rn0n-xsV6Dh|Eb2E:KCOӪv4SJCr"J!!m,hRLD| ZYFm/X~ΧfrN&4Ƒ=Z9Mh.Mܵw/BdrܥniŪ8ɧ|y%œ[M=_tj?F!z5\evM:\ ~F-sg钬OWq“iiȍ<Gi%%n2rqͻllƑ)okw7}\Uk-:&fj솘XerV9yZuʼşdFC=rmo%~ZN78X(N)_7.Εn1MpJ}62jjJdI";R5&iLԸc:jmqiQj$ujp\{;v5B񥍪Xn Ą4qOERjzN(Ga٠䌡)p*v(J7#ZۻZ8O W uONb+^Qipv9GvֽƼϯrYƖKGJQDNPhRJjᡧC"21"9ѓS1;R_O7/WGz)8fE%F2ukmvSov/iZ&/]~KmI[:^~ͤ\kMi稜\ywJt3W7 8Ʒ~ݥeFgѼw"8VVSج\뻆}ݭ/J6Q)d|)zU3>k\L=;ow֯gN3pKѫ|wmkZ$z^2R:E)f>ς нd|#׆?\ǔpV{;\$ƵE%-ͪm0S6[n< kE[}mvE4DDZ^$OZ0*$~XUv҅B@^?]so#%ojw;Y#SxxueBگy v^i-)s)zV jC{7Gt.w3v,ygg8s]aE_,*E tY5k٨h=o"m泏:\6w噓aiL׎n^c\75AGkЯ0Lf46َ`egZ˓p/k;̛]kq!ݸzpԭG"}R9Ve>ˏHUjJ-&7nrnwG*Xv\˱/vN}O)ʼn&CV͍f̵]r\PMB-6Du-#RͰtRN^)mT _}nSȕC*_xBuTkJW[`ɩ`ejvsngP ڻ.-WUtܑqԹQj)t;vN&RNũT+8%IXӃ5fK՛-d9 ]CƑm|nZ-6=Hz,*aEm W3VzRšdY~Xf׀Xx"]s;)5u*ُHB BRGS6bݶؿ 9j[1*jױga7oX CUI%0v#~\-O-Ꙛuɷ쏪&5mY٦M`LJ2qK~HZbr =N'YobI. (^ ׾{_ ?OJ`S`3BN[}5w6:ǵ/iSlt=4F*d&T4y/#. ɵim5Uֲf 眕6Y7 fơ=3dϕq뚩$qTM-%r!$@A? ޾V0c~{[{;򥧅a~ڵ»&ڄv1ek=wb MLkNAԬw-x>~/r=e73VeVN)K%Sښe"+3uXuچrn ֺVzscJ峻m}vb㶓n\YbIUBT%*,0nov=;z꣓S/nSXSpl##k9mXGrZv^Gde!ŷRԠzQyjC]`gToPov{j~KRBMY}i[߶9KL2ԉO0K#m>wB[ٍ+n[[b٦DX ݲpo] [\m5qdT()mo4Oy9Ie b][wղmM~vmi۱~t \}$яimRk(L c Cvk7r9_r1 ;zv|F@KyZ[&jEji/"6$69ml#e]9s\{ScL}Ȣؿ0q/nZ*t,CLoD߉Njǚy=Pgmu6^]l-["çUʖMlʍp-"qmU>۷uFOJ%Ǔkx 'g=睋k[3u,{³WɘݪF]ՍeFX"Oy\,cچ=w/gn Ļ]#2? vqy-gXnR.^}ݺFs{ŝG]}e|#0mjx"ƬWكm?rgU^xVB":Dt>@LRbun~ݭ,w+v⪕;\U(RYa61>#Jm˞Μ9g9XKaG='u8gf}'qy#ɉw J]We.ʲ-<+&q%s?2dњztҼn`cΤmmqMdz O[-ߩӲ&;[tmܝVnr">{x<8U+p:Ig]zjGkt,uzf}dؠoJaکqEq -(:d<պ=eKy[˗^%ZXkX[C2߱\ITTLGzANM￵i]K>UsOGDDD.ZF6* ҃V Zhz{'xp^`wo8r0h ZmJ5"jb[l=yUu7-;7IT%:jFjߖm0tzU'K)څNۧYJ)4IQ}^KWm7kSP>q;ނ#)'n7&׊r?óM{IwR\j2Qn[v pe#/tAF\ϵ225q֒om6z})6҅*oqDsMf CNIN=T S2t,_ѧ}kveMF0J\Rnnݙܹy[rUc-j{yGtkQ%s]5qB.Nw.JN1LvR Ui5J ZESQԙr):MJ+g}χ!2;q([jAud][ljVK3$ײSJI=/|&tl'*n۽f.frܥ jQO8>&Z];.|7T/C}$ڋUmP2Reҭ8hFF\L 3~e v\۫]ݝNmrnB%*]Z«hKc=BTLG :V74$=Ǘy+EX'4tn(I:Ѝ;Df8c,k1%dJ6.j6ź{N~l6&*fœI7 WAlGOu-ҢH,,(ǔe뿋쩨kM܍ZſgRvQ' 9)?n|er˭|I|-fGK.rΛp8XV1%K6mvG+tc+qE&ǸC_Nm:l=_/m5^[dߌڇ.c<%:)tQ$Ow~-aY;UJ>=F)2[nk؆?훐M=l6[4(O.]2#-H^n#->&mp5~Fӛ+|| S,xag%qkEUzUgæBhߕP(7]kFnq?֖CpruZ6*rEڊtS|*tI*E}7R<,nUU֫^I7Q*mSly%rdȓd8hE<9oHhMfNSRj[i7D[Rj݊+kდq{"$$H?p\̅S?㭻;t~R߁)^/>Qj`yt[w ԛ;²~+ߔ_ YW~|o]?x^ᯛ `ʼn;g)T@vWn]>&4lp+$D̢1l|ȨF%-}.9[}w~ ԠLM9hСablfe&QoW!s?wjLK?s7yO>(=C~_nyǜu?v3vyo oI@qV-jeES^[9WoSܝh"l2C1a͔CiJ@3:Pճw=/7ovuk+\V;lDgն<[A+rX~d;m!_s8ݖ׷;;.0llUC+?i#_crʙ1~C.\–q ul8Hܶ2m`ܻM3Tov|Bs rɵ"oLS- DКw=Tv@f'6|YlD͓Y%׵-#Ѯo%:&!3o%\J<02;K87>^vgƓ# ;ݝmz^Y6=PS39U%~ &f# }o!muH;ʲŇ˷yvP+&.7e[3'vR4Yj̗IZ`e˽3o[WU{ m[sUbۋZǾۆl6~9'V*.\S2<Sd*zY[aŶ`]C$n.v^Ʌ dng>ەZ,Mmϑ :n6nϦezWqUJ4! ۇ4R! =>>Fn|Q[{pRO17ƕ~._I''00k=b՛o}Osðc2'o\3}ݭQ^2 . R1yKȣtAݿ-uܾw!`?1Whn|gzUo[ECWwjUIן)^h#1ɭ!/Z np;o;ΗŻkXs."6E`Z1 עӐ9Kl8qd q} 2Stt;#j>;խabONŗ=fwP1j)l6J̶|gV2`y/0E˛6+ԫ1? 6}KW c\KoKͨ2ۅFw–s*TԞLיuDx .kCzWXhy۶gLu|%TnupǺl-S* PRaLnT+c+*xl.v!.U=|; !_L̎뱚U=4hm:ٯ"y)$:>%(n}X'p[ȴ ^˒4kƓmzDx \ 'NqamP7nyN݅=j7%McSڵj%STy qXymvCg{w/w=wSW5r̹u erծˊsOm=DhEҚRb#n)QOxtվQwe]I}wCa'"[ۂ-z}2UuKP$㜉ԧ:mc<Ý>RoL?wu|%ҷ&K y_!y9 ??:tq3(UU-lkS'ɸ@jdzQˬR] EVPW1DJq2n:,c|ǻ̑;y{X,ۂ.u.b˕u.tKBjQ"[S園S`ٮdNبeJ&9Ơ ~0a(Vm٘L+Jr*vڑE( x0+tp˕ n';wm-ޜMOxX>{#2%jgb2M[`K*\5@8l'e=0u+w ֘鳾{y܀:R*Ya]"Ӧ%ktynlۣ65,3gU}{GYrb;ge'TKwǘ.,rpܚV]Tr,!dp /ԺU,xՉ>s׽~W5oTh yx?xrrx?)?ilbT׬,z$Ԏ.UH٠\U1pU:]JwSrGZq8àd驐,N67QYBӢD㏙W!Q25ϸo9ms-7-%3CihO.J鯽-;MZM8ku-7k9S$8]q2E(}bۏI[DKOK}3KUB^u %Y,u.-&f#]'܆o$x`Yu,dzwM;#oKxn;\[d7}Rb+*Y䛂ZuBӱl{j0O̓}LhK;[aֶaGL{Cb#S.T[>߃F]NK"u^LUʐ_ykW?!GRj29͖qa'0[npcDvV)qz9R)PۨM^aJx W] r>];eN3vxdmĘ(5W2K1䪖weF{mE/QP6\u54x5[hۮ-Nk”i[lUgL]J}5 S:EhiUrgHl!ŒJ$pe=q^b͵Q' ?6|R\,JA ڵ"TDꈭ:ymg`B5t%M] <N_zv2_Ortٵ/i/ReӮ*7[qүqEG* m"[I:6e^p"I$jԴęh!m)]GZkcjS!{e^z}+Cѥ9;R|/ֱeiUԏCNu2Zhcٗg$ݭwvr P8*7/Lk~I'Km1+MW%Bk|oOm>-#qj*|Dbѱkn|n{v#jĮqNpMIUm(7Liz;{ҜݞڝVƚVϬ+sO!OstGvxӉ']uӎ4g_ 1^-8ۦ k!)Ύ5O;YSB#2Zzχ;<.ֵOtge~.(RC#wFZeGZٸ6FFJ4e2ˇpJT$[wgV)q6muDGJ56q\I!̗ y/I~RtJ9kJ]Iy*'FN0s.[l!fw'y(7$œ WƫgyΙdMEU JQJv̋vmrۖ.jWR_M֨djYgSj0^\y'EoECjm$ IƩK>Z28J2TiJ2N#}.s cArl嫶nB.FIJ.)۔\ZiM>/hLĸ=C1s[?YMqp|94- 鮝𦔽/k^#NT(Y LS$6˩}{;5 )B۷W$qpN)qqoot}ZDVә;7TiK|6f3h$dԄ}fqݡ>Nb򗉉+ͶO]>ߡ_VtYf79ڰիF sq~prս|QM)g%l0ocJȨHz V;Bb/kLAcfPJ,ԭ{ƍgpjNR6VSI*$!yV足jᇑ.](EܣqM\qJ2eZT).<9UB/(B0j)mtKEj#׿fDI-=rZړj|'Nڤ]k*i$5qt"ݙPM6E4ke^Z8ۏhz$Q(R Ay2zfRñnpnkbkI:=j &ΝșW?׵d{+ύM'??XqeeĽ.[o=UxFS=ӷdZwenՄ]_X=ĭVa* pKs0ބۍfJ3 gz̚i|wnxtjc¼5${(1fXQ65ȼb̶Zkn>%FQMJXӡ{TZEVNᖣimT/37cNJUPnP҂ZOE~"-Rc4^b- FEͧtf5[)S!OZIښݲ͑;tvܡ+N)AR=hCNn;wL16-:特7M$=Tҕ-.R[HٷnXk sn[ҞD-0WS9p9:-Ϸ-jѬNu{ҹfv)[Ľvwfg(ٷfe+0mYj8Q1\ݧg]Eǎvڿc!4#j5̋C2"}BRriFp7=ô\TZ:\BLfj#I22װ<;صZl j 6:l"6]۸ K'6RTѯ^ئOԓV\?$x7s#r:Oh{ց=MmuHԷd{pN /܅:UE#Yy+(SgQ(Щ)RHzw>^Ѿݻ>mK&^ '$Jۻ&w%F|xfz%˳ L~3N?Cy9 v w/{ƿ kz3x> sXv}vP"@WyC z`'톽Dw%-tt yVY\wmuPYQA0iG-2JP,6/gˢ]u.-n!Zw.N7Q]Df}Q0({a\@=i_X7gFǘ8^⻲}G MZ1)WEfO12G+=-B@z\`||w6ċj߬m}UwRox֢I &c~XGP6Qndpvܻul'V7^FJt^{b^B(L~sѣ6@߿^xqU!ڙ5|Vpvef-uӥ^3  FSDɯKD%0r}FF穛r7 +o"V8tv̖NQU!5uFd"bCr^bJ=֤fM#ʳԷP0O-9xRBm\=`r-:;~3Tl(nXtXi%2Vٛ#vwqƴ`L@"H‹qW.j,JM5B[)WܺUeZFqc'V˷1W7V̾-MHФwn8N;HPSdݷC7&2j.W\τGŎ'Vb]c.x+Rx1%C2T{myg[qU|+m:M:շ8҉yWd)ՋWS%%:iqlʹmGwݹ WnNŤѩ5(9hTٵDdGUi-)vSs2 2{OnT$Xck n:¶(lASLeȔBjμPpTb2~N2~%^k[ܗ[Jzs0ӓHBKq[}JَA-$dFQgjxxFv4r/x*Rm% `4J(&iv7SkԲmSH1YWmx 8n.k']:Z˭_W >ڃXЩ. jTq%Aā[E}amc]D:rmHRiu:uӚӢ\p(5-q%e)(۬ҖȽIf<߽pr&ݫVfY91q2ĭEQgYbTGQ&,yL+N$[q*RVۉQ=FuTܻ>f>f㋳8N6$܌n)9&»iˤsX,݅܍ȩv+sRTpO}d?Wn/Inpȸ%O]StQO|v5\}7Zwb.AIVK^:wb{[uݯcytO߶S<{8KSRׁH̏N7ۚ[xkwYy_'ZӵF+>쌛ZUĦreE9F[24De{}@:ExWs-\ǻ7K-\JNvEk%:s˙#κ].oͳ;լ7wB6nwu:$L; DkI#Wz.:Xp(˅v$Sq,wn\qIN-e<5Oe+vuYTpcojUI_ާP8 O 7&VL8z$_B-H-[uh]T{|8=qVRN-:Ij:7PUtXϷmy鉿:RIM~33ӸS2#׳GdŲ5+/Bx{(WzȨ5Y㞎#|˖+ ط.|e<o/rߔX>7s}VE.OVti׽ .5nNJO"95{#q}Ay9do]R"M6z\tnNS-D!@3N_jicWsy*5uٮRcWv/.,j}=S)j5C^> Ie =gu9ӛqjtz]۪TMoߧI!Ǧ¶m:,"[L!{qAv-o 3{"KʼnrIkfٶj2ƙ؄S`7` k6jzޞ?e5G&6uʷ2%ԒRKE*G\Npom F/V |C0.q_eenƣ<5Oh'67ɪn[SĽ{ڔjǘzs;~׌(ۂ`ܢ1ƣ` _l9Va6%UQWh~P~\F^ZHR@:ۧCJ{ôGeBh;~ۧnU J\O+n2 RҠ)ng}Kh{5+S×ܛ.1ZjG)iRȤIN 4%{oΜ/eO[Nffd ĹK?nnԼMqX'܌nZvq<ķbFnͪaQ`5 s,M_լ?-@_{w{ӺձJ}GF[%v\5[ŒGkOw/ΜM9rjË%2+rd~+󲕛C9U۳r[aJǭm|˒LAʨSCq[XMۺoubfp:t+ΤĻo ][ zt-*67kvS7D·MMCQXm;)܎n_h%]4ܙnRk!]ڵsDUF"`R, &#R_*[z*ZqFXɻ]7|۵w+'pFDەs=r./ᐚm3Hשy yD"jHCr':sA65نѮ^o1V/ f;nFr3VM)e*- s D'H݅fӧ\*޷[k<7u<-]֍Q8R h|p=WlW3s%Q %3l}@U-K6f-NϿu|ڴmWN׮[׸F*mW\%r! C78:޳vBG7ŵ.JթԚ2x)ST!řn~9 W:Wpܢ件{xf8ٳwKE ҰWxVB\qBZ 2wMb[lGSnyԚ~z9ZmያvoN2Afnݽjf>)j3 !;gOYʹK" Wftڎ+׭b*2ϻK>ۢӱeyԪXISUm[z+ugX%0lϏnvg!;t{BqPj>PyvR7Cj]O%+ݲ :qiMj6W}3vC/R=4Som]ŗ=ю, TF6U_-\6MyskwMr&Q\wjKܩyMϣUj0*}RZܷSdY3>Zjqj6TgzpA/M`/Cmл,޻feE[/+uk^Vs1W$G(JsW2ٰu*߻q*Y޵.Wi:ur5T),=0uRmho.twܖiYwrWHntvEj8qhf`Ͻpf(R&>Ki%I7$QӖm-2 ~yߗQ-앑/ x[k8nw.c㩵k}]FkbJl:{.(˩n0Hqvαp7 귎.Gupx[N`Yq'+ruU7[ү+>!xrȫoSo]OC# d^Q]\>!ƛGw^Mx"-+%vdX-:M2UR%d>%l ioSu6lsj7D P>XxHz Ukà(n^Q V>5cVtWj SEiJdznyej[lE' 3kuٌNn4JW)gB {4 j6&]' m-(ZMEz8cz>WZ6#7+[,MR-Z!4ܓtCyE|umj1ƽvƷV\;%>Q :#Le(iVz5 4ũۤUWxX ^(ҔsլB2w-V ^R+; ˂M\z+Uwr+RWY⺧~ Q*JcYSNSλUd8in=v K낫k\IRרSUaCFmϿ5̗P|u ZTԕ}>oYѲ1sfP+sQkX8Gb~6r,s>^\,mGL+7[n-E\.Fqḕcl*Jmjb5 ,m]c}NXfeVlǸJ5eˡ$4%g~N p4Y*WwW٧<8v#;qԩTut,m"#Y D\5V`\\Lȋ];LȇiS6ϝZ l>LruR\v=ǘϔDg=ԈdFZ+M{=|,[;0>RiSi4,S5}yxw&(E7&fݙ4UՕ! ~'Id)]ǽu2K-fޭ \08Vڅ쓬=Vy^^ IhyKR-B#Ըr=]mܻӾ'*Umkoy rTqT_i,/8Q^<ݤ|4ԻO(܄"'5N~#m.(Ҿ2i6Uev&I*<}҄$eNtÛzyWJubW^iBW.܅Wڮg]irO6Ve90sgv.+sV޿aޔ[p?3q*FutUo*eL\KM'EG*ZcAFfG5J 5jj=MJ3OK:k˝'NMB7m3uFҕ\-Ywg%PRqMIyZGY9|μvn߻5cWݷa^+X֥vnݘ\v7m>Fgzv"-;Ew֝}1|RjN𿊀7g#֟*GQQ|#/bo]p$>_Un9гUbn9׃ErQBU-^vDmVh'<R[fdHT]*~}3j;nvjc7s-rӳ Y8[n[1pJx kX[Jk9Mn!_Nю6x:iZ˦U |߉^Ԛ݃hYxk &U^bwKk.[jE+P(˞=9j@snCv7%c_7=xǁ<l {t'酚+1F‹l׭:ݻILruǶkL-L(K0L1&>wXB(pm;1fpnlp֓%Skidkt(U +xulo'/ڕeN r=^pZZ:Pnj8Hf"48ijY[ N[yZٻ+=  ø:3 ?^ܷ^Sr#YK[UF?CuhC b]GM')mڏsNrܗI]ljq6VB. W,UK"YX5{c >Iqā> T:n!,5l2VzCl|+I[*SrjnS6٨y+x,@>П.g+!rn9>N|W>OZT_ut Y""v7|sfި;Pclm EùN,{'fNT%U&LfH8~1v>Il}统u6P˗c(WV~H^bMU.o*oOF0N:_:6Smr_.b+|ݶYY غF,mwjv>f*>QM뭱Sd:`N{l/⎱;n-z~"Gze퇎J5S KG9!Gn;N1 ݎ h6m|S?ɂ5'WOÞ 7|7^ao @mxGmi^jϽ>01Mf0լD3-2T. VXR"ɥV Kl J O7|u?bvа;6.eߓ|[1bmRr,eRz`z 6܎-ͨku͹Fː dPhYgZUj}nvX;z=gVեTv_J }\1n7w2J?ޘγc\E 1Aޑzq;\r]]\Y&[nsNei\uURje*Qk2CSl*xJz-xٶlm+|UjUؓ`Ladqiĩ!Gd\W~fz;Tn*PdRM&T4`չSWq5k훶(N"Ӎ% V]֦wb.nUO!u*J&Oӕ2e|Z=eV쫚΅g#+/RW:طnbi*Wyo)p{:ETKؚR(RY+r웓r(IF) VmȵNB:h Q1ғ|u8E]{,'$-TR[j49l*3"I鯴zhd>Q+\BkNF=.$ZR4Nwհ(IpNi.(Gi33#33e$FXK*NdWrud[r{xnk$v2ıh+J1TQ[#JQl[tRO]LHKٮ NӍnF񨔤֞Em'MILB"ԋ%dBŋ+p̿_17jzT~4pc Vo\ƹb9Rq-'1j;8ܗ)hE%DZKS<璸Bu*%*Yw5ڻ9ۣ^z4U; Ñk\U(o~G?VUĎ:?P?_F_Kߤ~ᓾI |pr.Ok\SklRhҪz{­P .}SktZ7UQ4ڌIM8̈eaӊJZ%FFZu,KZvln廐SNFIVtuNi?CM5]+Ph,{jN JSR$IS^tSUVrORYu.9WyP6 [Kiu m!X|]Y79ӄ)\ģ)pbڳr%*&ꑶ_-H*dzk)1 V3')UAϹٶWRxe'պn۫h7AR9 EAJeGLms!%D| A 5]/Q3eb̄vnVn%za\m kZnv([emqrIҕij|""><hjJשvvǕ|Pޟs}V~2&Z?+2N&Z4w@)4iSڪ_>/JN9Hiۏuf8'It[ȲR.hZ$ȋ_Y ~U<UUO*6b)Ovzڜj\R̋.$FsQuҊj^נ䈈y<zZIuP[}Qm=C?zN(Exqu/kn S-FzKZzOסӽjJ\)F3b!r5ٝ|;6 o=-3*λ]αb\abqRi-w޵⦪~b8Kpo)Z=>)ғ"5/GTZLE-輵f7ݘ۹~+&+w/7GFI:l33fg.N~۲\2|*cnermnnM+Fq"ѪIz%j =YW8@~gc/~?N'?)«qȸs➟n=k" X“m֮VreMh2[uݖ] *FܖN)MȐ`f0 g,C9̑o;ddudJ=In13:ݒvvdMUEJLp^,6t-@͐9'{7m{-3,>hnF;ѰM)->>+Ěz!R* :`e--m7nB\u{b U>[8֪]6^ߤLʦ\DFNo$$dͶlgno8OrsQ\l̯hRo8tuNo+ CTxu!2[>ctFpeޓƻֶR"3QrQuOѳgwQr;S~)6HhZw/GgVTmUf_yt7%$];zLWF̰xy2Ʉu!MCmš_0[W6jf#a-KLi+3Q7c^qg%s<1aYIQeZf+}>;S6L0]Yu_h9߻<ƅpmiM$AVvŚ,*#t2.8Y)-Zhshü97/#Oro"u^/uFgWɺ,p:6a,^x%$Yve^3PƗMnTP&yS}OJ '덫MH^:rXԴJۋ/rI;S*,+yz1hv)Qw^ڍJ2oL׊q(\fDj:^T%vOadɂnS}ZO)N*λdaȜkG_PIEO}нa(^iQX᯦-7^)%g'SJx(.S9zVɴZ{E ))ۅi/s7 VIV-|sj0*UBTHIqRf>FP$KqN0 R̻8j\GcC}IUz\i 6F)Q{Gҧ3qSzKj-Az VЛS-zy:8*mNk|D鿓ND2u+0Yŝ7kqm·?8Ib]u>˗^_>(]vӋzv+ݩ){vZrJ2RQ몋C$z [,pp,8mڊbR]Il .f~d/ݓs㓓mͶ{mgjQwn=Oic9ܚm4Q/6ݨ[TƧ?nԶoytf{@AzT{e{[O'ZRZt~AGD?s3􌿂ՉIw'|~U\ w~di:Kޱ)U/sU%njѩ&GSP^ǝd)..!^U` 1wX[aԇSxoFV6_扐)T 2Mfd=ۖͭiZ7KK Bi9%7@<3<ճԻU,},a}FRqɛr i@ONJvK KLN M, ʖv0n-]DwlI-X6ܶ$Jʴh5O+mOI+Ra瞠\ MG7BفjYo1#͖0V`Ѱ2M?c8>-Crt*JkIGS:e#hPKx[鱼>{5m;wcն&>j-M֥^َ) 6yȜl_w{-ō̱r> U=]iw3)r*]:K]6BdCTZ|>gf}LW}[$'Y5 &c -j.z6R 67MԷFMnÌwI7w5E}o޽+K ֵy4܌ȥW"COyR[q5Ӱ͙f[v"_#q{MV6܍3"u9BK(41ӯqˇc${ߝCi6I(OmθzҜ5k^:>Jzw.>qV8{vU[ڶEm|DžBz].KHjI]x;Mɗ{m,qZXr忇2u^RO2Z}ZێS[2Jen!*NDcrBUً4<ǼMҲs1Zw57c3&ĖڻzmP*FuJG1-dN:|OU}ҵgi2t~F^^Z.VxjvŧnNNh<:]^~NN+ge^g.SԔGFe߯'[vn'(ScJ]kܗ7eJOlRrfziݮq̋S"\*U<*W]k$FջV}? 7g#֟*GQQ|#/bo]p$>_Un9;l S VvQU%OLU{οmU6bZ1MTx%!֙Q7, J=!3 ;Q,ڌ;6ͱ݅q^&ߔ·n #WbwӖX.HtG)N&d̵zpI,n cu ޖUj+VXUp[w]N o.J6Z8Ts&utxln;~HPHS/xw`G\ʡ¿rj Z^vt"[L:SD\h0sUwR,}[x^X,R2Vn< ]2YDr[SRKs8tXb̷G?Ps Tv 3be,zVz D[/I.KOEQrm'$7|[J>r S`5յwT#\w1FTz\Ԛ &"ׅhSHrD\'r]~/>p;:Piuu:"9ő=tTaS7V2rӷk7mb[^WmPp*[y.Þ6f]cizJCgRR@UVl큝.WJP1N{/\whZ ػϧӱE7|E֫Sί.x-Y&pi%v''-x6r'Ws*6=DwwUu]=C?MK [yrtܒG$!WGqJ*%SAz ED[^)/tė/g=#Omd.|^n/sl׉g DZqemqowݮRzUܜ=ڽ-o/Iۖ;qVʘgPp|mm;6zGl9.8pwWgsJ2qPbe}}UpNjٯ}7TMQKrؽtEx%v w߾8%|j;~|}pK]ơ/ w߾8%|j;~|}pK]ơ/ w&~e_H 8PL7:%ʭ5Kw&U2vwR_+rm'}C7#rWoO&HoG?M$UR7{FU]u ;# !Wk`|W>׹潇9Vn)6)*ҹ{%qV4q>W1vi#T"Qk&GwxcJBJ- Ϸ^ˁxkU}ԣ/3.;]J=<*)cS)ROK9H=,r zX @)cS)Da^ԽQ gxJI=w֣gf*TRj

*Corresponding Author (E-mail: dsyu216@korea.kr, Tel: +82-63-238-4910, Fax: +82-63-238-4859)
• Received: December 15, 2021   • Revised: February 10, 2022   • Accepted: February 13, 2022

Copyright © 2022 by the Korean Society of Breeding Science

This is an open-access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

  • 7 Views
  • 0 Download
prev next
  • Plant germplasm is a part of living genetic resources, including seeds and plant materials, such as roots, leaves, and stems, and should be conserved and managed to maintain ecological biodiversity and to consistently generate the product and supply food crops. Plant germplasm can be categorized based on various genetic traits such as race, and clustering based on similar genetic traits is an efficient method for managing large numbers of germplasms. Therefore, we developed an algorithm, termed cacGMS (Clustering Analysis for Categorical genetic traits of germplasms in Genebank Management System), using categorical variables which statistically differentiate the datatype of genetic traits such as seed-coat color, seed shape, and flower color. Briefly, using Newman’s modularity method, cacGMS combines the hierarchical clustering algorithm using the Ward2 method and representative-based algorithms such as K-medoids, and it regroups all germplasms using germplasm core sets. We tested cacGMS using 2,378 pepper germplasms with 46 different categorical genetic traits, and it exhibited better performance than the hierarchical and K-medoids algorithms for the average distance among clusters (0.4534) and entropy (1.2672). Moreover, cacGMS showed better performance in terms of threshold (from 15 to 30) for genetic traits than other algorithms and provided similar results in a test run using tomato germplasm. From these results, we expect that cacGMS will be a useful tool for managing each group with numerous plant germplasms and facilitate the analysis of other studies, such as analysis of representative characteristics of clustered germplasms and of correlations among germplasms in a particular cluster.
식물 유전자원(Plant germplasm)은 종자(씨앗)을 포함하여, 뿌리, 잎, 줄기 등과 같이 식물생장이 가능한 영양체를 아우르는 생물자원을 의미하며, 유전적, 형태적 다양성 확보, 활용가치가 높은 유용자원 발굴, 식량자원의 가치 증대, 생태계 유지와 보전에의 기여 등으로 인류에게 있어 매우 중요한 자원이다(Xepapadeas et al. 2014). 식물 유전자원은 동일 종(Species) 내에서도 다양한 유전형, 표현형에 따른 품종(Race)으로 세분화될 수 있는데, 유전적 차이와 함께 기온, 강수량과 같은 기후영향과 토양의 이화학적 성질, 재배, 수확에 대한 인간활동의 차이 등과 같은 다양한 변화에 따라 식물의 표현형과 유전자형이 유전적으로 차이가 나타난다. 따라서 환경변화에 따라 병 저항성, 해충 저항성 등의 자원 특성에서 안정적 식량생산에 필요한 유용한 형질이 발견될 수 있다(Nicotra et al. 2010). 이는 식물 유전자원의 확보와 장기적인 보존의 이유와 목적으로, 기후변화 적응, 병 저항성, 작물 생산성이 우수한 신품종 개발과 유용한 형질을 이용한 육종 및 재배기술 등과 같은 농업기술 발전에의 기여, 나아가 생물해적행위(Bio- piracy)로부터 자국의 유전자원과 생물주권을 보호하기 위하여 식물 유전자원의 확보와 관리가 중요하다(Oh 2014).
다양한 형질의 조합에 의해 표현되는 수많은 유전자원을 보존 및 관리하기 위해서는 자원을 수용할 수 있는 공간과 장기적인 보존을 위한 유지비용, 그리고 전문지식을 갖춘 관리인력이 요구된다. 그래서 수많은 자원에 대한 효율적인 관리를 위한 방법으로 수집된 자원의 초장, 엽색, 종자색, 과형, 과폭, 초형 등과 같은 다양한 형질에 대하여 모든 특성평가 정보를 포함하는 핵심집단(core set or core collection)을 선발하고 핵심집단을 중심으로 관리하는 방법이 통용되고 있다(Kim et al. 2007, Moe et al. 2012). 핵심집단은 전체 유전자원의 유전적 다양성을 최대한 포함할 수 있는 최소 자원의 집단을 의미하며, 모든 특성평가 정보를 아우르는 최소의 자원으로 전체 자원의 특성을 관리할 수 있는 장점이 있다(van Hintum et al. 2000). 그러나 다수의 자원을 이용하여 자원 간 유사성에 기반한 대표성 분석, 형질 간의 상호관계, 형질 변화 패턴, 표현형과 유전자형(genotype)과의 연관성 등과 같은 유전적, 생물학적 연구를 위한 자료로 활용하기에는 제한적이고, 다양한 형질의 조합에 의해 나타나는 자원의 특성을 소수의 핵심집단으로 분석하기에는 어려움이 있다. 따라서 전체 자원에 대한 특성평가 정보를 종합적으로 분석하기 위해서는 자원을 유사한 특성으로 분류하고, 군집단위에서 자원의 대표성을 분석하고 군집 간의 차이를 비교함으로써 장기적인 보존을 위한 자원관리와 신품종 개발, 육종 등에 활용할 자원을 다양한 형질의 상호적인 관계를 고려하여 거시적으로 선택할 수 있는 방법이 필요하다.
본 연구는 다수의 유전자원을 군집하여 유전자원의 분석과 연구목적의 관리에 대한 효율성 증대를 위하여 특성평가 정보를 바탕으로 유사한 특성의 식물 유전자원을 군집하는 알고리즘(cacGMS, Clustering Analysis for Categorical genetic traits of germplasms in Genebank Management System)을 개발하였다. cacGMS는 R-project (Dessau & Pipper 2008)의 패키지에서 제공하는 Ward2 알고리즘(Murtagh & Legendre 2014)으로 계산된 트리(tree)를 이용하여 군집하는 계층적 군집(hierarchical clustering)알고리즘과 임의로 선발된 대표객체를 바탕으로 군집을 형성하는 대표객체 기반 군집 알고리즘(representative-based clustering algorithm)인 K-medoids 알고리즘(Park & Jun 2009)을 통합하고, 핵심집단을 적용하여 유사한 특성을 나타내는 자원의 군집을 생성한다. 본 알고리즘의 성능을 평가하기 위하여 국내 농업유전자원센터(Kim et al. 2010)의 씨앗은행(genebank.rda.go.kr)에서 제공하고 있는 고추와 토마토 유전자원으로 시험했을 때, 계층적 군집 알고리즘과 대표객체 기반 알고리즘보다 군집간 평균거리와 엔트로피에서 cacGMS알고리즘 성능이 높음을 확인하였다. 따라서 식물유전자원의 특성평가 정보에 대한 분류와 관련한 육종연구 및 자원관리에 있어서 본 알고리즘의 활용도가 높을 것으로 기대된다.
식물유전자원을 분류하기 위하여 cacGMS 알고리즘은 자원 간의 차이를 거리행렬(distance matrix)로 계산하는 전처리 단계(Preprocessing)와 계산된 행렬을 바탕으로 계층적 군집 알고리즘과 대표객체 기반 알고리즘으로 자원 군집화(Clustering), 군집된 자원 재구성(Ensemble) 및 핵심집단을 적용(Ensemble+)하는 단계로 진행된다(Fig. 1).
전처리 단계(Preprocessing)
전처리 단계는 각 자원에 대한 범주형 자료로 구성된 특성평가 정보를 기반으로 각 자원 간의 거리행렬(distance matrix)을 계산한다. 유전자원의 특성평가 정보는 자료의 형태에 따라서 연속된 구간의 수치(연속형)나 셀 수 있는 숫자(이산형)로 표현되는 수치형과 특정 범주로 구분한 범주형을 포함하고 있다. 예를 들어 고추작물의 특성평가 정보는 초장, 추경장, 과폭, 과장, 엽장, 엽폭 등은 연속된 숫자로 표현되는 수치형 특성평가 정보와 옆색, 종자색, 화색, 과형, 초형, 착과형태, 등은 특정 범위로 구분된 명목형 특성평가 정보, 그리고 발병률(%), 병 저항성(%) 등과 같이 연속형으로 표현되는 자료임에도 생물학적 의미에 따라 범위를 정의하여 순서가 있는 범위로 구분한 순서형 특성평가 정보를 포함하고 있다. 그런데 수치형 자료는 초장, 엽폭, 종자 수 등과 같은 양적 형질의 자료형이 대부분으로 환경적 영향에 의해 관측치의 변동으로 분석결과의 부정확성이 발생할 수 있다(Chung & Kim 2017). 더욱이 수치형 특성평가 정보에서 결측치가 다수 존재하는 경우에는 해당 값을 추정하기가 어렵다. 반면에 범주형 특성평가 정보는 순서형과 명목형을 포함하며 전문가의 의견을 수렴하여 범위를 구분하였기 때문에, 비록 정보의 손실을 감안하더라도 생물학적 근거를 바탕으로 군집할 수 있고 결측치가 존재하더라도 식 1과 같이 자원의 특성 비교를 통해서 두 자원 간의 유사성을 추정할 수 있다. 따라서 cacGMS 알고리즘은 자원 와 에서 공통으로 측정된 범주형 특성평가 정보(Ni,j)가운데, 서로 일치하는 특성평가 정보(T) 수의 비율(Si,j, 식 1)로 계산하고, 식 2와 같이 거리 값으로 변환하여 거리행렬()을 완성한다. 두 자원 사이에서 결측된 정보가 적을 수록, 는 높아지게 되므로 두 자원 간의 유사도와 거리 값에 대한 신뢰성은 높아지게 된다. 참고로 결측치가 있는 연속형 자료의 경우에도 범주형으로 변환한다면 본 알고리즘으로 계산할 수 있다.
(1)
Si,jnTiTj/Ni,j
(2)
Di,j1Si,j
군집-재조합-핵심집단 적용 단계
전처리된 자원은 계층적 군집 알고리즘과 대표객체 기반 알고리즘을 실행하는 군집단계(Clustering), 각 알고리즘의 군집결과를 재조합하는 단계(Ensemble), 그리고 핵심집단을 적용하는 단계(Ensemble+)로 진행된다.
군집단계에서는 계산된 거리행렬에 대하여 cacGMS 알고리즘은 Ward2 방법(Murtagh & Legendre 2011)을 이용한 계층적 군집 분석과 K-medoids 알고리즘을 이용한 대표객체 기반 군집 알고리즘으로 유전자원을 분류한다(Murtagh & Legendre 2011 Park & Jun 2009). 계층적 군집 분석은 덴드로그램(dendrogram)을 이용하여 계층적인 구조로 데이터를 구성함으로써 시각적으로 군집의 구분이 용이하며, 대표객체 기반 알고리즘의 K-medoids는 이상치나 잡음이 많은 자료에 적합한(Arora et al. 2016) 알고리즘으로 cacGMS에 적용하였고, 각각 R 프로그램의 factoextra 라이브러리(Kassambara & Mundt 2017) 와 cluster 라이브러리(Maechler et al. 2013)를 사용하였다. 계층적 군집과 대표객체 기반 군집 알고리즘은 군집 수를 지정해야 하는데, 최적의 군집 수를 결정하기가 매우 어렵다 따라서 cacGMS 알고리즘은 지정된 범위 내에서 평균 실루엣 너비(Average Silhouette Width, ASW)가 높은 군집 수로 결정하였다(Rousseeuw 1987). Ensemble 단계에서는 두 알고리즘의 군집을 통합하는데, 각각의 알고리즘에 의한 군집 수와 군집 내 유전자원의 구성은 서로 차이가 나타날 수 있기 때문에, 이분그래프(bipartite) 평가방법인 Newman’s 모듈화(modularity) 기법에 기초하여 군집을 재조합한다(Dormann 2020, Dormann et al. 2021), 그리고 재조합된 군집은 핵심집단을 적용하여 최종적인 군집결과를 도출한다. 예를 들어 Fig. 2와 같이 계층적 군집과 대표객체 기반 알고리즘에 의한 군집이 모듈화 알고리즘에 의해 3개의 모듈(module)이 생성된 경우, cacGMS는 M1과 M2 모듈과 같이 두 알고리즘에 공통으로 포함하는 자원을 하나의 군집으로 조정하고 공통되지 않는 자원은 분리함으로써 군집을 재조합한다. 재조합 과정에서 M3의 H3과 H4는 R3와 비교하여 같은 군집인 E5로 통합되고, R3의 노란색 자원은 H3와 H4에 포함되지 않으므로 E4로 분리된다. 이 후 핵심집단 정보가 없을 경우에는 E1~E5 군집을 생성하며 알고리즘이 종료되고, 핵심집단 정보가 있다면 재조합된 군집 내에서 핵심집단 자원의 포함여부를 확인하여 Ensemble+ 단계를 수행한다. 핵심집단의 자원이 포함된 Ensemble의 E1, E2, E3군집을 최종으로 결정하고, 핵심집단을 포함하지 않는 E4와 E5 군집은 알고리즘의 성능을 고려(Gülagiz & Sahin 2017)하여 대표객체 기반 알고리즘 결과에 따라 군집을 다시 하나로 통합한다. 핵심집단은 자체 실험, 혹은 PowerCore (Kim et al. 2007), Corehunter (Thachuk et al. 2009)와 같은 프로그램으로 결정할 수 있는데 본 연구에서는 PowerCore 프로그램을 사용하여 알고리즘의 구동과 성능평가에 사용하였다.
알고리즘 성능평가
알고리즘의 성능평가에 이용된 고추 유전자원은 1990년 이후 특성평가 정보가 조사된 총 6,756 자원과 46개 범주형 특성평가 정보를 이용하여 시험하였다(Supplementary Table 1). 사용된 고추 유전자원의 종과 원산지별 분포를 분석했을 때, Capsicum annuum을 포함한 총 12종(Fig. 3A)과, 총 114개국 원산지(Fig. 3B)가 확인되었는데, 종 분포에 있어서는 Capsicum annuum var. annuum이 가장 많은 수를 보였고 원산지는 한국(KOR)이 가장 많았다. 그리고 종과 원산지가 서로 유의적인 차이(Chi- square test, p-value<0.05)로 나타났다. 따라서 유전자원의 특성이 종과 재배⋅증식되는 환경과 관련이 있다는 점에서 특성평가 정보에 기반한 군집은 종 분포와 원산지 분포가 유의적으로 차이가 있을 것과 각 특성평가 정보가 분류된 군집과 관계가 있을 것으로 가정할 수 있으므로 카이제곱 검정(Chi-square test) 방법의 유의수준(p-value)을 통해 이들 관계를 검정하였다.
군집 알고리즘에 사용되는 범주형 특성평가 정보에 있어서, 줄기흰털, 엽색, 종자색, 과형, 착과형태 등을 포함한 다수의 평가 항목에는 기타나 혼립 같은 모호한 분류기준이 존재한다. 이는 자원의 다양성 및 특이성 판단, 증식/재배환경에 따른 이상형질 발생, 조사자의 주관적 의견 등으로 인하여 특성평가 정보가 정해진 분류기준에 부합하지 못한 경우에는 기타나 혼립으로 분류되지만, 기타나 혼립을 제외할 경우에는 해당 자원 정보의 소실이 우려된다. 따라서 본 연구에서는 현재 유전자원의 특성평가 정보를 최대한 활용하여 성능을 시험하고자 기타 및 혼립을 분석대상에서 제외하지 않았다. 그리고 군집 알고리즘을 실행할 때 사용한 특성평가 정보의 최소 수(Threshold)는 군집 간 평균 거리, 군집 내 자원의 거리, 엔트로피를 종합적으로 판단하여 18개(2,378 자원)로 지정하여 비교하였다. 하지만 특성평가 정보의 최소 수에 따라 사용되는 자원 수가 달라지는 점을 고려하여 추가 비교분석에서 특성평가 정보 수를 15개에서 30개로 변화시키면서 알고리즘의 성능 변화를 상호 비교하였다.
종, 원산지와의 관계, 특성평가 정보의 관계를 통한 알고리즘의 군집결과의 평가와 함께 자원의 밀집과 군집상태를 분석하여 알고리즘을 평가하기 위한 척도로써 군집 간의 분리성(separability), 군집 내 자원의 밀집성(compactness)과 동질성(homogeneity)을 측정하였다(Kim 2012). 군집결과에 대한 분리성, 밀집성, 동질성은 각각 군집간 평균거리(Average between, 식 3), 군집 내 자원간 평균거리(Average within, 식 4), 엔트로피(Entropy, 식 5)로 평가할 수 있으므로(Halkidi et al. 2002, McClain & Rao 1975, Meilă 2007), R 프로그램의 fpc 라이브러리를 이용하여 계산하였다(Dessau & Pipper 2008, Hennig 2015).
(3)
Average between=meandistance(Ck,Cl),Ck,ClC and
(4)
Average within=meandistance(Cki,Ckj) for germplasm i and j
(5)
H(C)=k=1KP(k)logP(k),P(k)=nk/n,n=number of germplasms
고추 2,378 유전자원(Threshold=18)을 대상으로 PowerCore에 의한 핵심집단 58개 자원과 함께 cacGMS 알고리즘을 수행했을 때, 계층적 군집 알고리즘은 6개, 대표객체기반 군집은 5개, 통합모형은 핵심집단을 제외했을 경우 23개, 핵심집단을 포함했을 경우 8개의 군집을 생성하였다(Fig. 4). 특성평가 정보에 따른 자원 세분화는 Ensemble 단계에서 가장 크게 나타났고, 대표객체 기반 알고리즘이 가장 작았으며, 핵십집단을 적용한 군집(Ensemble+)는 일부 세분화된 군집이 나타났다. 계층적 군집과 대표객체 기반 알고리즘의 군집 수가 적음에도 불구하고 cacGMS 알고리즘에 따른 Ensemble 단계에서 군집 수가 늘어난 것으로 볼 때, 각 알고리즘에 의한 군집 내의 자원이 서로 차이가 있음을 유추할 수 있다.
특성평가 정보에 따른 군집화에 있어서 종은 자원의 계통분류학적 특성을 나타내며, 원산지는 자원의 생태적 환경을 의미하므로, 특성평가 정보에 의한 군집화는 종과 원산지의 차이가 반영되어야 한다. 이를 확인하고자 종과 원산지 분포에 대해서 각 군집 알고리즘의 카이제곱 검정(Chi-square test) 결과는 모두 유의적인 관계(p-value<0.05)를 보여주었다(Table 1). 따라서 계층적 군집, 대표객체 기반, 그리고 cacGMS 알고리즘에 의한 군집은 종과 원산지 분포에 대하여 무관하지 않음을 추정할 수 있고, 이를 근거로 군집 정보를 바탕으로 특성평가 정보와 함께 종, 원산지를 이용한 연구에 활용할 수 있다.
군집 알고리즘은 사용된 특성평가 정보를 기반으로 자원들이 분류되었기 때문에, 군집결과에 특성평가 정보의 차이가 반영되었는지를 확인함으로써 군집 결과에 대한 성능을 유추할 수 있다. 따라서 각 알고리즘에 의해 분류된 자원의 군집과 46개 특성평가 정보의 차이를 카이제곱 검점으로 시험했을 때, 대부분 유의적인 차이가 있었다(p-value<0.05). 그러나 Table 2와 같이 담배모자이크 바이러스(연번 24)와 흰가루병 발병률(연번 31), 신미정도(연번 45)는 모든 알고리즘이 공통적으로 유의적 차이가 확인되지 않았고, 일부 특성평가 정보에 대해서는 유의적 차이가 알고리즘마다 다른 것으로 보아 일부 특성평가 정보는 군집분류에 반영이 되지 않았음을 알 수 있다. 그런데 각 알고리즘 간의 비교에서 특성평가 정보가 미 반영된(p-value>0.05) 개수가 Ensemble+은 가장 낮은 4개이고, 계층적 군집 알고리즘과 대표객체 기반 알고리즘은 각각 6개, 8개로 확인되어 Ensemble+의 군집결과가 다른 알고리즘보다 좀 더 반영되었음을 추정할 수 있다.
각 알고리즘별로 자원 군집의 적절성을 추정하기 위하여 군집간 평균거리, 군집내 자원 간 평균거리와 엔트로피로 비교하였다 (van den Hoven 2015). 그 결과, cacGMS 알고리즘이 군집 간 평균거리와 엔트로피에서는 가장 좋은 결과를 보였고, 계층적 군집 알고리즘은 군집내 자원간 평균거리에서 성능이 좋은 것으로 확인되었다(Table 3). 이 결과로부터 유사한 자원 간의 밀집성은 계층적 군집 알고리즘에서 우수하지만 군집 간의 분리성과 자원 간의 동질성에 있어서는 cacGMS 알고리즘의 Ensemble+ 성능이 우수함을 알 수 있었다. 그리고 Ensemble은 가장 많은 군집이 확인되었음에도 분리성에서 Ensemble+와 함께 타 알고리즘보다 성능에서 우수함을 보였지만, 군집 수가 높은 것은 Ensemble+ 군집이 세분화된 결과로 판단할 수 있다.
추가로 활용가능한 특성평가 정보의 최소 수를 15~30개로 변경하면서 성능을 분석하였다. Fig. 5와 같이 각 제한되는 정보에 따라서 자원 수, PowerCore에 의한 핵심집단 수, 원산지 수는 자원의 수에 따라 감소하여 군집 수도 점진적으로 감소할 것으로 예상할 수 있다(Figs. 5A, 5B). 그런데, Fig. 5C에서와 같이 cacGMS알고리즘의 군집의 수는 최소 수 증가에 따라 감소하지만, 계층적 군집 알고리즘은 특정 조건(Threshold=28, 29)에서 군집 수가 증가하였고, 군집간 평균 거리와 엔트로피가 특이적으로 나타났다. 그리고 대표객체 기반 알고리즘은 최소 수와 핵심집단의 수, 원산지 수의 감소 변화에 관계없이 군집 수가 거의 변하지 않았으며, 군집 간 평균거리, 군집 내 자원간 평균거리, 엔트로피에서 낮은 성능을 보였다. 따라서 cacGMS 알고리즘은 계층적 군집과 대표객체 기반 알고리즘보다 자원의 군집 분류 성능이 우수함을 추정할 수 있다.
고추 유전자원 외에 토마토 2,191 유전자원을 대상으로 미숙과색, 과피색, 세로 과실모양 등, 24개 범주형 특성평가 정보를 사용하여 동일한 방법으로 시험했을 때, 고추 유전자원과 마찬가지로 제한된 특성평가 정보에 따라서 군집간 평균 거리와 엔트로피에서 핵심집단을 적용한 cacGMS 알고리즘(Ensemble+)이 우세하게 나타났다(Fig. 6). 따라서 범주형 특성평가 정보를 이용한 유전자원 분류에서 cacGMS 알고리즘이 유용함을 확인할 수 있었다.
군집 알고리즘의 활용적 측면에서, 다수의 유전자원에 대한 군집화는 개체 간의 유사성 및 집단의 대표성 분석, 집단의 우점 정도 및 특이적 집단 분류, 군집별 특성 분석에 사용할 수 있고, 생물학적 혹은 작물 다양성 분석, 특이적 특성 도출 등과 같은 유전자원 활용 연구를 위한 의미있는 정보의 생산에 이용되고 있다. cacGMS 알고리즘은 특성평가 정보를 활용하여 유사한 자원을 군집단위로 분류함으로써, 군집 내 유사특성의 자원을 동정하고 특이적 자원 선발을 위한 유전자 마커(Genetic marker) 개발(Odong et al. 2011), 종, 원산지, 유전적 다양성 분석(Chen & Nelson 2005), 품종육성을 위한 자원선발과 같은 육종연구에의 활용(Lee et al. 2021), 그리고 개별적으로 선발된 핵심집단과 함께 집단을 중심으로 다양한 특성의 유전자원을 효율적으로 관리하고 보존할 수 있는 체계를 확립하는데 활용할 수 있다. 향후 정보에 대한 질적 향상과 함께 연속형과 이산형을 포함한 수치형 특성평가 정보의 결측치를 보완하고 전문가에 의해 범주형으로 변환하여 본 알고리즘에 적용하게 된다면, 기후변화, 경작지 환경을 포함하는 농업생태계 변화에 적응하는 유전자원 특성을 연구하는 것과 같이 다양한 농업분야(Jarvis et al. 2010)에 활용될 수 있을 것이다.
식물 유전자원은 종자를 포함하여 뿌리, 잎, 줄기와 같은 식물의 일부분이 재배 및 증식에 활용될 수 있는 자원으로, 생태적 생물다양성을 유지하고 안정적인 작물생산과 보급을 위하여 보존 및 관리되어야 한다. 형태적, 유전적 특성에 따라 식물 유전자원은 다양하게 분류할 수 있는데, 유사한 특성에 따라 유전자원을 분류함으로써 효율적인 자원관리, 대표성 검토, 유용한 형질의 유사자원을 이용한 다양한 품종개량 등에 활용할 수 있다. 본 연구는 식물의 종피색, 화색, 종자형태 등과 같은 범주형 자료를 대상으로 유전자원을 분류하는 cacGMS (Clustering Analysis for Categorical genetic traits of germplasms in Genebank Management System) 알고리즘을 개발하였다. cacGMS는 R 패키지의 Ward2 방법을 이용한 계층적 군집 알고리즘과 K-medoids 알고리즘과 같은 대표객체 기반 알고리즘을 통합하여 핵심집단을 적용함으로써 유전자원을 분류한다. 본 알고리즘의 성능을 평가하기 위하여 씨앗은행에서 제공하는 고추의 46개 범주형 특성평가 정보를 사용하여 고추 2,378 유전자원을 시험했을 때, 군집간 평균거리와 엔트로피에서 각각 0.4534, 1.2672로 계층적 군집 알고리즘과 대표객체 기반 알고리즘보다 성능이 우수함을 보였으며, 토마토 유전자원에서도 cacGMS 알고리즘의 효용성을 입증하였다. 본 알고리즘을 통해서 특성평가 정보에 따른 수많은 유전자원을 효율적으로 보존하고 관리할 수 있을 것이며, 유전자원을 활용한 데이터베이스 구축과 육종개발을 통한 신품종 개발, 식물 유전자원의 표현형과 유전자형과의 연관분석 등 다양한 연구에 활용될 수 있을 것으로 기대한다.
본문의 Supplementary Table 1은 한국육종학회 홈페이지에서 확인할 수 있습니다.
본 연구는 농촌진흥층 연구과제 ‘유전자원 활용도 제고를 위한 DB화 및 서비스(PJ014226)’의 지원을 받아 수행하였습니다.
Fig. 1
Pipeline of cacGMS algorithm.
kjbs-54-1-16-f1.jpg
Fig. 2
Example for the ensemble and ensemble+ clustering method.
kjbs-54-1-16-f2.jpg
Fig. 3
Distribution of species (A) and origin (B).
kjbs-54-1-16-f3.jpg
Fig. 4
Groups clustered by hierarchical (A), representative-based algorithm (B), Ensemble (C), and Ensemble+ (D) with threshold= 18; x-axis, category (46 genetic traits); y-aixs, cluster number.
kjbs-54-1-16-f4.jpg
Fig. 5
Pepper genetic resources’ distribution and clusters’ estimation by threshold (the number of genetic traits); A, Sample (bar) and Core set (red); B, Species (red) and Origin (blue); C~F, the number of clusters (C), average between (D), average within (E), and entropy (F) by ensemble+ (red), ensemble (blue), representative-based (green), and hierarchical algorithm (orange) including linear regression (dot-line).
kjbs-54-1-16-f5.jpg
Fig. 6
Tomato genetic resources’ distribution and clusters’ estimation by threshold (the number of genetic traits); A, Sample (bar) and Core set (red); B, Species (red) and Origin (blue); C~F, the number of clusters (C), average between (D), average within (E), and entropy (F) by ensemble+ (red), ensemble (blue), representative-based (green), and hierarchical algorithm (orange) including linear regression (dot-line).
kjbs-54-1-16-f6.jpg
Table 1
Chi-square test for each algorithm against species and origin
Table 1
Algorithm Section Statistic Degree of freedom p-value
Ensemble+ Species 3778.16 56 <0.01
Origin 2657.68 644 <0.01
Ensemble Species 4413.43 176 <0.01
Origin 7449.45 2024 <0.01
Hierarchical algorithm Species 4948.50 40 <0.01
Origin 3357.02 460 <0.01
Representative-based algorithm Species 3117.55 32 <0.01
Origin 2535.04 368 <0.01
Table 2
Genetic traits with chi-square test, p-value>0.05
Table 2
No. Genetic traits (in Korea) Ensemble+ Ensemble Hierarchical algorithm Representative-based algorithm
11 Male sterility * *** * ++
20 Cotyledon color *** *** *** +
24 Incidence rate of tobacco mosaic virus ++ ++ ++ ++
25 Incidence rate of cucumber mosaic virus *** *** ++ ++
30 Incidence rate of tomato spotted wilt virus ** ++ ++ ++
31 Incidence rate of powdery mildew ++ ++ ++ ++
32 Incidence rate of bacterial wilt (index) * + *** **
40 Resistance of pepper bacterial spot (Bs2) *** *** ++ ***
43 Resistance of potyvirus(pvr2) ** + * *
44 Resistance of potyvirus(pvr4) ++ * * ++
45 Hot-taste level ++ ++ ++ ++
No. genetic traits (p-value>0.05) 4 6 6 8

*, significant, <0.05; **, very significant, <0.01; ***, extremely significant, <0.001; +, very insignificant >0.05; ++, extremely insignificant >0.1

Table 3
Estimation for clustering algorithm with threshold 18 (≤ available genetic traits)
Table 3
Method Ensemble+ Ensemble Hierarchical algorithm Representative-based algorithm
Cluster 8 23 6 5
Average between 0.4534 0.4496 0.4454 0.4337
Average within 0.3122 0.3046 0.2974 0.3086
Entropy 1.2672 1.5114 1.4326 1.5301

* Bold numbers represent the best results.

  • Arora P, Deepali , Varshney S. 2016. Analysis of K-means and K-medoids algorithm for big data. Procedia Comput Sci 78: 507-512.
  • Chen Y, Nelson RL. 2005. Relationship between origin and genetic diversity in Chinese soybean germplasm. Crop Sci 45: 1645-1652.
  • Chung IK, Kim K-M. 2017. QTL Analysis of concerned on ideal plant form in rice. Korean J Plant Res 30: 213-218.
  • Dessau RB, Pipper CB. 2008. "R"-project for statistical computing. Ugeskrift for Laeger 170: 328-330.
  • Dormann CF. 2020. Using bipartite to describe and plot two-mode networks. R. R-project.
  • Dormann CF, Fruend J, Gruber B, Dormann MCF, LazyData T, ByteCompile T. 2021. Package 'bipartite'. R-project. https://cran.r-project.org.
  • Gülagiz FK, Sahin S. 2017. Comparison of hierarchical and non-hierarchical clustering algorithms. Int J Comput Eng Inf Technol 9: 6-14.
  • Halkidi M, Batistakis Y, Vazirgiannis M. 2002. Cluster validity methods: Part I. ACM Sigmod Record 31: 40-45.
  • Hennig C. 2015. fpc: Flexible procedures for clustering. R-project. https://cran.r-project.org.
  • Hintum vTJ, Brown A, Spillane C. 2000. Core collections of plant genetic resources. Bioversity International. pp. 6-8.
  • Hoven Jvd. 2015. Clustering with optimised weights for Gower's metric. Amsterdam University.
  • Jarvis DI, Padoch C, Cooper HD. Jarvis DI, Padoch C, Cooper HD, 2010. Managing biodiversity in agricultural ecosystems [Korean version]. editors. Biodiversity, agriculture, and ecosystem services. Columbia University Press. New York, USA: pp. 19-29.
  • Kassambara A, Mundt F. 2017. Package 'factoextra'. R- project.
  • Kim CY, Lee JR, Yoon MS, Cho GT, Baek HJ, Ko HC, Cho YH, Jeon YA, Kim CK. 2010. Present status and future perspectives for the use of genetic resources in Korean agriculture. J Korean Soc Int Agric 22: 231-240.
  • Kim K-W, Chung H-K, Cho G-T, Ma K-H, Chandrabalan D, Gwag J-G, Kim T-S, Cho E-G, Park Y-J. 2007. Powercore: A program applying the advanced M strategy with a heuristic search for establishing core sets. Bioinformatics 23: 2155-2162.
  • Kim K. 2012. Fn-measure: An external cluster evaluation measure. J Soc Korea Ind Syst Eng 35: 244-248.
  • Lee JY, Choi HJ, Son CK, Bae JS, Jo H, Lee J-D. 2021. Genetic diversity of black soybean germplasms with green cotyledon based on agronomic traits and cotyledon pigments. Korean J Breed Sci 53: 127-139.
  • Maechler M, Rousseeuw P, Struyf A, Hubert M, Hornik K, Studer M. 2013. Package 'cluster'. R-project. https://cran.r-project.org.
  • McClain JO, Rao VR. 1975. Clustisz: A program to test for the quality of clustering of a set of objects. J Mark Res 12: 456-460.
  • Meilă M. 2007. Comparing clusterings-an information based distance. J Multivar Anal 98: 873-895.
  • Moe KT, Gwag J-G, Park Y-J. 2012. Efficiency of powercore in core set development using amplified fragment length polymorphic markers in mungbean. Plant Breed 131: 110-117.
  • Murtagh F, Legendre P. 2011. Ward's hierarchical clustering method: Clustering criterion and agglomerative algorithm. ArXiv abs/1111.6285.
  • Murtagh F, Legendre P. 2014. Ward's hierarchical agglomerative clustering method: Which algorithms implement ward's criterion? J Classif 31: 274-295.
  • Nicotra AB, Atkin OK, Bonser SP, Davidson AM, Finnegan EJ, Mathesius U, Poot P, Purugganan MD, Richards CL, Valladares F, Kleunen vM. 2010. Plant phenotypic plasticity in a changing climate. Trends Plant Sci 15: 684-692.
  • Odong TL, Heerwaarden vJ, Jansen J, Hintum vTJL, Eeuwijk vFA. 2011. Determination of genetic structure of germplasm collections: Are traditional hierarchical clustering methods appropriate for molecular marker data? Theor Appl Genet 123: 195-205.
  • Oh SY. 2014. Access to plant genetic resources and its benefit sharing system - Focusing on the relationship between Nagoya protocol and ITPGRFA agreement -. Environ Law Rev 36: 213-233.
  • Park H-S, Jun C-H. 2009. A simple and fast algorithm for K-medoids clustering. Expert Syst Appl 36: 3336-3341.
  • Rousseeuw PJ. 1987. Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. J Comput Appl Math 20: 53-65.
  • Thachuk C, Crossa J, Franco J, Dreisigacker S, Warburton M, Davenport GF. 2009. Core hunter: An algorithm for sampling genetic resources based on multiple genetic measures. BMC Bioinform 10: 243-255.
  • Xepapadeas A, Ralli P, Kougea E, Spyrou S, Stavropoulos N, Tsiaousi V, Tsivelikas A. 2014. Valuing insurance services emerging from a gene bank: The case of the Greek gene bank. Ecol Econ 97: 140-149.

Download Citation

Download a citation file in RIS format that can be imported by all major citation management software, including EndNote, ProCite, RefWorks, and Reference Manager.

Format:

Include:

cacGMS: An Algorithm Cluster Germplasm based on Categorical Genetic Traits
Korean. J. Breed. Sci.. 2022;54(1):16-24.   Published online March 1, 2022
Download Citation

Download a citation file in RIS format that can be imported by all major citation management software, including EndNote, ProCite, RefWorks, and Reference Manager.

Format:
Include:
cacGMS: An Algorithm Cluster Germplasm based on Categorical Genetic Traits
Korean. J. Breed. Sci.. 2022;54(1):16-24.   Published online March 1, 2022
Close

Figure

  • 0
  • 1
  • 2
  • 3
  • 4
  • 5
cacGMS: An Algorithm Cluster Germplasm based on Categorical Genetic Traits
Image Image Image Image Image Image
Fig. 1 Pipeline of cacGMS algorithm.
Fig. 2 Example for the ensemble and ensemble+ clustering method.
Fig. 3 Distribution of species (A) and origin (B).
Fig. 4 Groups clustered by hierarchical (A), representative-based algorithm (B), Ensemble (C), and Ensemble+ (D) with threshold= 18; x-axis, category (46 genetic traits); y-aixs, cluster number.
Fig. 5 Pepper genetic resources’ distribution and clusters’ estimation by threshold (the number of genetic traits); A, Sample (bar) and Core set (red); B, Species (red) and Origin (blue); C~F, the number of clusters (C), average between (D), average within (E), and entropy (F) by ensemble+ (red), ensemble (blue), representative-based (green), and hierarchical algorithm (orange) including linear regression (dot-line).
Fig. 6 Tomato genetic resources’ distribution and clusters’ estimation by threshold (the number of genetic traits); A, Sample (bar) and Core set (red); B, Species (red) and Origin (blue); C~F, the number of clusters (C), average between (D), average within (E), and entropy (F) by ensemble+ (red), ensemble (blue), representative-based (green), and hierarchical algorithm (orange) including linear regression (dot-line).
cacGMS: An Algorithm Cluster Germplasm based on Categorical Genetic Traits

Chi-square test for each algorithm against species and origin

Algorithm Section Statistic Degree of freedom p-value
Ensemble+ Species 3778.16 56 <0.01
Origin 2657.68 644 <0.01
Ensemble Species 4413.43 176 <0.01
Origin 7449.45 2024 <0.01
Hierarchical algorithm Species 4948.50 40 <0.01
Origin 3357.02 460 <0.01
Representative-based algorithm Species 3117.55 32 <0.01
Origin 2535.04 368 <0.01

Genetic traits with chi-square test, p-value>0.05

No. Genetic traits (in Korea) Ensemble+ Ensemble Hierarchical algorithm Representative-based algorithm
11 Male sterility * *** * ++
20 Cotyledon color *** *** *** +
24 Incidence rate of tobacco mosaic virus ++ ++ ++ ++
25 Incidence rate of cucumber mosaic virus *** *** ++ ++
30 Incidence rate of tomato spotted wilt virus ** ++ ++ ++
31 Incidence rate of powdery mildew ++ ++ ++ ++
32 Incidence rate of bacterial wilt (index) * + *** **
40 Resistance of pepper bacterial spot (Bs2) *** *** ++ ***
43 Resistance of potyvirus(pvr2) ** + * *
44 Resistance of potyvirus(pvr4) ++ * * ++
45 Hot-taste level ++ ++ ++ ++
No. genetic traits (p-value>0.05) 4 6 6 8

Estimation for clustering algorithm with threshold 18 (≤ available genetic traits)

Method Ensemble+ Ensemble Hierarchical algorithm Representative-based algorithm
Cluster 8 23 6 5
Average between 0.4534 0.4496 0.4454 0.4337
Average within 0.3122 0.3046 0.2974 0.3086
Entropy 1.2672 1.5114 1.4326 1.5301
Table 1 Chi-square test for each algorithm against species and origin
Table 2 Genetic traits with chi-square test, p-value>0.05

*, significant, <0.05; **, very significant, <0.01; ***, extremely significant, <0.001; +, very insignificant >0.05; ++, extremely insignificant >0.1

Table 3 Estimation for clustering algorithm with threshold 18 (≤ available genetic traits)

* Bold numbers represent the best results.