Chào mừng Quý độc giả đến với trang thông tin điện tử của Viện Khoa học Kỹ thuật Nông nghiệp miền Nam

Tin nổi bật
Thành tích

Huân chương Ðộc lập

- Hạng 1 - Hạng 2 - Hạng 3

Huân chương Lao động

- Hạng 1 - Hạng 2 - Hạng 3

Giải thưởng Nhà nước

- Nghiên cứu dinh dưởng và thức ăn gia súc (2005)

- Nghiên cứu chọn tạo và phát triển giống lúa mới cho xuất khẩu và tiêu dùng nội địa (2005)

Giải thưởng VIFOTEC

- Giống ngô lai đơn V2002 (2003)

- Kỹ thuật ghép cà chua chống bệnh héo rũ vi khuẩn (2005)

- Giống Sắn KM 140 (2010)

Trung tâm
Liên kết website
lịch việt
Thư viện ảnh
Video
Thiết lập chuỗi giá trị nông sản thông minh và an toàn tại Việt Nam Cà chua bi

Thống kê truy cập
 Đang trực tuyến :  33
 Số lượt truy cập :  34004569
Trí tuệ nhân tạo (AI) sẽ làm sáng tỏ bí mật của gen không mã hóa

Từ các chatbot thông minh đến các ứng dụng có thể viết toàn bộ bài viết, trí tuệ nhân tạo (AI) đang ngày càng trở thành một phần phổ biến trong cuộc sống của chúng ta. Michael Schon, cộng tác viên nghiên cứu tại Đại học & Nghiên cứu Wageningen, đang thiết kế một công cụ AI có thể thực hiện so sánh RNA không mã hóa trên bộ gen thực vật.

Từ các chatbot thông minh đến các ứng dụng có thể viết toàn bộ bài viết, trí tuệ nhân tạo (AI) đang ngày càng trở thành một phần phổ biến trong cuộc sống của chúng ta. Michael Schon, cộng tác viên nghiên cứu tại Đại học & Nghiên cứu Wageningen, đang thiết kế một công cụ AI có thể thực hiện so sánh RNA không mã hóa trên bộ gen thực vật. Ví dụ, công cụ này được kỳ vọng sẽ đẩy nhanh và đơn giản hóa việc phát triển các giống cây trồng mới có khả năng chống chịu hạn hán hoặc bệnh tật tốt hơn trong tương lai. Schon đã nhận được tài trợ Veni để hỗ trợ nghiên cứu của mình.

 

Protein là khối xây dựng cho các tế bào trong sinh vật. Các hướng dẫn tạo ra các protein này được phát ra (mã hóa) bởi RNA từ gen. Bên cạnh các RNA mã hóa này, một số gen có thể tạo ra các RNA không mã hóa: nói cách khác, RNA không bao gồm các hướng dẫn tạo ra protein. Michael Schon cho biết loại RNA này cũng đóng một vai trò quan trọng trong sự phát triển của sinh vật. “Ví dụ, họ có thể kích hoạt gen hoặc làm ngược lại và tắt chúng đi. Điều này sẽ ảnh hưởng đến hình thức bên ngoài của cây và các đặc tính mà nó có. Một số RNA không mã hóa quan trọng nhất định cũng quyết định liệu cây có đạt đến độ trưởng thành hay không”.

 

Họ hàng trong cùng một họ

 

RNA không mã hóa cũng có khả năng tiết lộ lý do tại sao một loài thực vật thuộc một họ cụ thể nhưng lại có những đặc điểm khác nhau. Trong nghiên cứu trước đây, Schon đã xác định được các RNA không mã hóa của cây Arabidopsis thaliana (thale cress). Loại cây này được các nhà khoa học thực vật sử dụng làm sinh vật mẫu. “Arabidopsis thuộc họ Brassicaceae, cùng họ cải với các loại cây trồng quan trọng như bông cải xanh, súp lơ trắng và su hào. Tuy nhiên, rất khó để so sánh các RNA không mã hóa của cây Arabidopsis với các loại thực vật khác trong họ cải mù tạt vì nghiên cứu trước đây về những loài này chủ yếu tập trung vào các gen mã hóa protein”.

 

Chú thích hạn chế của RNA không mã hóa

 

Điều này có nghĩa là việc so sánh giữa các cây trồng đòi hỏi phải chú thích gen riêng biệt cho RNA không mã hóa cho mỗi loại cây trồng. Thông qua dự án Veni, Schon đang tìm kiếm những cách mới để xác định các RNA không mã hóa bằng cách sử dụng kiến ​​thức từ các loài liên quan. “Có hơn 200 trình tự bộ gen của các loài thực vật thuộc họ cải. Mỗi bộ gen được lưu trữ dưới dạng một tệp văn bản lớn bao gồm hàng triệu chữ cái đại diện cho các bazơ của phân tử DNA (A, C, T và G). Bởi vì các bit không mã hóa không được phân loại (chú thích) chính xác trong các bộ gen này nên không thể so sánh tất cả các gen không mã hóa nằm rải rác bên trong núi dữ liệu này. Chúng ta cần những chiến lược và công cụ mới cho việc đó. Tôi đang cố gắng phát triển những thứ đó”.

 

Một phần nhỏ của mỗi bộ gen

 

Vấn đề đầu tiên là biết nên tìm ở đâu trong bộ gen. Một trong những công cụ mà Schon đang phát triển có tên là GeneSketch. Để tìm các phần tương ứng của các bộ gen khác nhau, anh đã sử dụng phương pháp có tên là Minisizer Sketch. Schon cho biết: “Ý tưởng đằng sau Minisizer Sketch là bạn chỉ cần xem xét một đoạn DNA nhỏ – một bản phác thảo – thay vì toàn bộ chuỗi. Điều đó có nghĩa là bạn chỉ phải chú ý đến vài nghìn ký tự trên mỗi bộ gen để thực hiện so sánh, thay vì hàng triệu ký tự. Bản phác thảo Minisizer trước đây được sử dụng để xây dựng một cây tiến hóa khởi đầu, bao gồm con người và họ hàng gần nhất của chúng. Hóa ra một cây phả hệ rất chính xác về tổ tiên của chúng ta có thể được tạo ra từ các bản phác thảo bao gồm ít hơn 1% toàn bộ bộ gen. Do đó, một bản phác thảo thu nhỏ là một cách rất hiệu quả để ước tính mức độ giống nhau của các đoạn DNA, do đó, nó cũng hữu ích trong việc so sánh các bộ gen trong họ mù tạt”.

 

Công nghệ tương tự như ChatGPT

 

Sau khi bạn biết nơi đâu để nhìn, bước tiếp theo là hiểu những gì bạn đang nhìn. Công nghệ Schon dự định sử dụng trong GeneSketch giống với công nghệ hiện đang được sử dụng trong các công cụ AI khác, chẳng hạn như ChatGPT. Schon cho biết: “Đó là thứ gọi là công nghệ 'máy biến áp'. Ví dụ, bạn có thể yêu cầu một máy biến thế điền từ còn thiếu vào một câu. Ban đầu, máy biến áp cung cấp cho bạn một từ ngẫu nhiên vì nó chưa từng thấy từ nào trước đó. Nhưng nếu bạn huấn luyện nó bằng hàng triệu câu ví dụ, nó sẽ dần dần học cách đoán đúng từ bằng cách chú ý đến các mẫu trong văn bản. Sau khi đào tạo, một mô hình ngôn ngữ lớn như ChatGPT trở nên rất giỏi trong một số nhiệm vụ nhất định, như trả lời câu hỏi hoặc dịch từ ngôn ngữ này sang ngôn ngữ khác. Một máy biến áp có thể được đào tạo để học không chỉ ngôn ngữ của con người mà còn cả ngôn ngữ của DNA, ngôn ngữ có các mẫu riêng biệt. Tôi đang nghiên cứu một mô hình để phát hiện các mẫu DNA của nhiều loài khác nhau và dịch các mẫu đó sang ngôn ngữ mà con người chúng ta có thể hiểu được”.

 

Người mẫu phải được đào tạo

 

Schon sẽ huấn luyện máy biến áp cho GeneSketch để chú ý đến cách gen thay đổi giữa các loài khác nhau, đặc biệt là các gen không mã hóa. “Một vấn đề quan trọng là độ tin cậy. Máy biến áp là một công nghệ tương đối mới và nó dễ mắc lỗi. Ví dụ: ChatGPT đã được đào tạo về nhiều nguồn văn bản khác nhau, nhưng nếu bạn hỏi nó về một chủ đề mà nó chưa từng thấy trong quá trình đào tạo, thì nó cần phải bịa ra điều gì đó. Bạn hy vọng rằng nó tạo ra điều gì đó hợp lý dựa trên những khuôn mẫu mà nó đã thấy, nhưng điều này không bao giờ là một sự đảm bảo. Bạn rõ ràng muốn tránh đầu ra vô nghĩa. Bạn càng huấn luyện một máy biến áp nhiều thì nó càng tạo ra ít thứ vô nghĩa hơn, nhưng việc huấn luyện có thể tốn rất nhiều thời gian và tiền bạc. Tốt hơn là đào tạo mô hình hoàn toàn từ đầu hay xây dựng dựa trên các mô hình hiện có? Tôi đang thử cả hai cách tiếp cận”.

 

Tiềm năng của GeneSketch

 

Schon hy vọng sẽ có được nguyên mẫu GeneSketch sau năm đầu tiên của dự án, bắt đầu vào tháng 10 năm 2023. Anh dự định sử dụng nó để tạo ra các chú thích gen cho toàn bộ họ cải mù tạt. Schon cho biết công cụ này có thể hữu ích không chỉ cho lĩnh vực nghiên cứu mà còn cho ngành nông nghiệp. “Ví dụ, nó có thể cung cấp cho các nhà tạo giống hạt giống một cách hiểu nhanh chóng về DNA của cây trồng và họ hàng hoang dã của nó. Bằng cách tìm hiểu thêm về cách cây trồng có thể phát triển những đặc điểm độc đáo qua nhiều thế kỷ, các nhà tạo giống có thể đưa ra quyết định sáng suốt hơn để cải thiện các đặc điểm, chẳng hạn như làm cho cây trồng có khả năng chống chọi tốt hơn với biến đổi khí hậu. Vì vậy, tác động tiềm tàng có thể rất lớn”.

 

Nguyễn Thị Quỳnh Thuận theo Đại học WAGENINGEN.

 

Trở lại      In      Số lần xem: 141

[ Tin tức liên quan ]___________________________________________________
Designed & Powered by WEBSO CO.,LTD