Mã vạch ADN (DNA barcode): Nguyên lý và ứng dụng


Được đăng: Ngày 13 Tháng 12 Năm 2015 14:12 | Viết bởi Hà Văn Huân (Chủ nhiệm Dự án) |

Mã vạch ADN (DNA barcode): Nguyên lý và ứng dụng

Mã vạch ADN (DNA barcode) là một khái niệm mới được đưa ra bởi Paul Heber vào năm 2003. Mã vạch ADN là trình tự nucleotide của một chuỗi ADN ngắn, có cùng nguồn gốc tổ tiên (orthologous), trong đó có vùng ít bị thay đổi (rất ổn định – bảo thủ) và có vùng dễ thay đổi trong quá trình tiến hóa. Dựa vào mức độ thay đổi trong trình tự ADN này để đánh giá sự sai khác di truyền giữ các sinh vật. Như vậy, mã vạch ADN là một phương pháp định danh mới sử dụng một đoạn ADN chuẩn ngắn nằm trong hệ genome của sinh vật đang nghiên cứu, nhằm xác định sinh vật đó thuộc về loài nào (http://www.barcodeoflife.org). Sau khoảng 10 năm nghiên cứu và phát triển DNA barcode, đến nay các nhà khoa học đã công bố trên 5 nghìn công trình khoa học trên các tạp chí khoa học chuyên ngành, với 3.483.696 trình tự mã vạch ADN ở 215.513 loài sinh vật, trong đó động vật có 144.402 loài, thực vật có 54.478 loài, nấm và các dạng sinh vật khác có 16.633 loài (theo tổ chức Hệ thống dữ liệu mã vạch sự sống - BOLD thống kê đến 1/11/2014; http://www.boldsystems.org/). Từ cơ sở dữ liệu trên cho thấy, hướng nghiên cứu xây dựng cơ sở dữ liệu mã vạch ADN đang được nhiều quốc gia, nhiều nhà khoa học trên thế giới rất quan tâm phát triển, đặc biệt trong những năm gần đây và sẽ là một xu thế nghiên cứu trong thời gian tới (Valentini, 2009, 2010; Maurizio, 2010). Mã vạch ADN được xem là một công cụ mới, hỗ trợ có hiệu quả trong nghiên cứu về phân loại, phát hiện loài mới, giám định loài và các mẫu có nguồn gốc từ sinh vật sống hoặc đã chết thậm chí đã qua chế biến, vì vậy mã vạch ADN có rất nhiều ứng dụng trong nghiên cữu cũng như thực tiễn (Nimis, 2010; Bruni, 2010; Bell, 2011; Hebert, 2003; Lahaye, 2008; Liu, 2010).

         Đến nay, nhiều kết quả nghiên cứu đã chỉ ra, có nhiều đoạn ADN đặc trưng được sử dụng làm ADN mã vạch, các đoạn ADN mã vạch có thể là những đoạn ADN nằm ở trong nhân (nuclear DNA - nDNA), như: 18S, 5,6S, 26S, 5S spacer và vùng ITS; nằm ở ty thể (Mitochondrial DNA - mtDNA), như: Cytb và vùng kiểm soát (control region); nằm ở lục lạp (Chloroplast DNA - cpDNA), như: matK, rcbL, atpβ, ndnF, 16S (Cuenoud, 2002; Kress et al, 2008; Aron et al, 2008; Spooner et al, 2009). Các gen thuộc cpDNA có tính bảo tồn cao và có thể được chia thành 3 nhóm như sau: Nhóm 1 là các gen mã hóa những yếu tố thuộc hệ thống quang hợp như phytosystem (psaA, psaB, psbA, psbB...), cytochrome b6f (petA, petB...), ATP synthase (atpA, atpB...), Rubisco (rbcL) và NAD(P)H dehydrogenease (ndhA, ndhB...) (Storchova, 2007) ; Nhóm 2 là các gen mã hóa cho các rRNA (rrn16, rrn5...), trnA (trnH, trnK...), RNA polymerase (rpoA, rpoB...), các gen tiểu phần ribosome (rps2, rps3...); và nhóm 3 gồm các khung đọc mở ORF gọi là ycfs (chưa rõ chức năng) và các gen mã hóa protein như matK, cemA. Có rất nhiều gen cpDNA tham gia trong phân tích phân loại thực vật như: 16S, rbcL, atpβ, ndhF, intron trnL matK,…trải rộng từ bộ cho đến mức dưới loài. Mỗi đoạn mã vạch ADN có những đặc trưng riêng và có khả năng phân biệt sinh vật ở các mức độ khác nhau. Ví dụ, các đoạn ADN như: 18S, 16S, 5,6S có khả năng phân biệt sinh vật ở mức họ và chi; các đoạn ADN, như: 26S, rbcL, ndnF, atpβ có khả năng phân biệt ở mức chi và loài; các đoạn ADN, như: ITS, matK, cytb, 5S spacer có khả năng phân biệt ở mức loài và dưới loài (subspecies, variety, strain) (Grant et al, 1980; Ford et al, 2009; Li et al, 2010; Chen, 2010; Hebert). Tuy nhiên, các nhà khoa học cũng đã khuyến cáo, chưa có đoạn ADN nào được sử dụng làm mã vạch chung cho tất cả các loài sinh vật. Vì vậy, việc lựa chọn những đoạn ADN (gen) đặc trưng để làm mã vạch và việc phối hợp giữa các đoạn mã vạch ADN là rất cần thiết và đem lại hiệu quả cao (Kress et al, 2008; CBOL Plant Working Group, 2009; Vijayan, 2010; Yao, 2010).

           Ví dụ, đối với động vật các nhà khoa học thường khuyến cáo sử dụng các marker nằm trên hệ gen của ty thể, như: gen cytb, gen COI và vùng D-loop,… Trong đó COI được coi là marker phổ quát và tiềm năng bậc nhất trong phân định loài động vật. Tuy vậy, các marker khác vẫn được sử dụng nhằm hạn chế các kết quả không mong đợi (Luo et al., 2011). Tuy nhiên, khác với động vật trên đối tượng thực vật, các nhà khoa học đã khuyến cáo việc sử dụng chuỗi trình tự COI là không thích hợp cho hầu hết các loài thực vật, bởi mức độ tiến hóa của gen mã hóa cytochrome C oxidase 1 ở thực vật chậm hơn động vật rất nhiều (Fazekas et al., 2008; Cowan et al., 2006; Chase et al., 2005; Kress et al., 2005). Ở thực vật, tốc độ tiến hóa của các gen trên ty thể không nhanh như ở động vật, do vậy không đủ sai khác để phân biệt được các loài. Vì vậy, thường sử dụng các đoạn ADN đặc trưng ở lục lạp và nhân để làm mã vạch ADN (Kress et al., 2007). Tùy vào mức độ phân tích mà mỗi vùng gen và mỗi phương pháp được áp dụng phù hợp. Tổ chức hệ thống cơ sở dữ liệu mã vạch sự sống (BOLD) khuyến cáo, ở thực vật ngoài vùng ITS ở trong nhân, nên dùng thêm các marker khác riêng rẽ hoặc kết hợp. Nghiên cứu của Holliingsworth et al., (2009)  đã chỉ ra sự kết hợp giữa gen matK và gen rbcL ở lục lạp để sử dụng như một mã vạch ADN có hiệu quả cao nhất trong định danh phân tử cho nhiều loài thực vật (Gao, 2011). Sau đó Kress et al., (2007) bổ sung thêm vùng gen thứ ba là vùng xen trnH-psbA. Tính đến năm 2009, đã có khoảng 8 locus gen được sử dụng làm mã vạch ADN ở các loài thực vật, bao gồm cả hệ gen nhân và hệ gen lục lạp (vùng xen atpF-atpH, gen matK, gen rbcL, gen rpoC1, vùng xen psbK-psbI, vùng xen trnH-psbA và vùng gen nhân ITSAB). Ngoài ra, BOLD cũng khuyến cáo cần kết hợp kết quả của nhiều vùng gen để tăng hiệu quả giám định loài. Ví dụ, một số tổ hợp, như:  rpoC1+rpoB+matK hay rpoC1+matK+trnH-psbA; rbcL+trnH và atpF-H+psbK-I+matK (Kress et al, 2007; CBOL Plant Working Group, 2009; Rol et al., 2010; Costion, 2011). Đối với nhóm vi khuẩn và nấm các nhà khoa học đề xuất sử dụng vùng ITS cho hiệu quả cao nhất, ngoài ra có thể phối hợp với  các marker bổ trợ như SSU-LSU, gene beta-tubulin, alpha-elongation factor để tăng độ chính xác (Hollingsworth, 2011).

                                                                                                                                                          Tổng hợp: PGS.TS Hà Văn Huân