Chào mừng Quý độc giả đến với trang thông tin điện tử của Viện Khoa học Kỹ thuật Nông nghiệp miền Nam

Tin nổi bật
Thành tích

Huân chương Ðộc lập

- Hạng 1 - Hạng 2 - Hạng 3

Huân chương Lao động

- Hạng 1 - Hạng 2 - Hạng 3

Giải thưởng Nhà nước

- Nghiên cứu dinh dưởng và thức ăn gia súc (2005)

- Nghiên cứu chọn tạo và phát triển giống lúa mới cho xuất khẩu và tiêu dùng nội địa (2005)

Giải thưởng VIFOTEC

- Giống ngô lai đơn V2002 (2003)

- Kỹ thuật ghép cà chua chống bệnh héo rũ vi khuẩn (2005)

- Giống Sắn KM 140 (2010)

Trung tâm
Liên kết website
lịch việt
Thư viện ảnh
Video
Triển vọng giống đậu nành HLĐN910 trên đất trồng tiêu

Thống kê truy cập
 Đang trực tuyến :  11
 Số lượt truy cập :  23981380
Hệ thống trích xuất thông tin từ tài liệu khoa học
Thứ hai, 22-06-2020 | 08:19:33

Nhóm nghiên cứu thuộc Đại học Heriot-Watt đang nghiên cứu hệ thống trích xuất thông tin bản mở, giúp trích xuất dữ liệu từ các tài liệu khoa học chính xác và dễ dàng hơn. Hệ thống này có thể tự động trích xuất các điểm chính có trong một bài báo khoa học, giúp người đọc quyết định nhanh việc có cần phải đọc sâu hơn hoặc các nội dung có thể liên quan với họ hay không.

 

 

Các hệ thống trích xuất thông tin (IE) hiện nay chỉ có thể trích xuất một phần nội dung của văn bản, hoạt động chưa tốt với các văn bản chứa các câu dài và phức tạp, nên hiệu quả chưa cao. Có hai hệ thống trích xuất thông tin phổ biến là hệ thống hẹp và hệ thống mở.

 

Hệ thống hẹp hoạt động dựa trên việc xác định chính xác mối quan hệ giữa các khái niệm có trong văn bản. Các nhà nghiên cứu cần phải chỉ định loại quan hệ mà nó cần tìm kiếm. Hạn chế của phương pháp này là số lượng tài liệu tìm ra ít, có thể bỏ sót tài liệu quan trọng.

 

Hệ thống mở hoạt động theo kiểu kết hợp ngẫu nhiên (scattershot). Mối quan hệ giữa các khái niệm không được định nghĩa trước, thường là sự kết hợp ngẫu nhiên giữa hai đối số. Hạn chế của phương pháp này là nó cung cấp cho các nhà nghiên cứu rất ít quyền kiểm soát với các nội dung mà họ đang trích xuất. Hơn nữa, cú pháp phức tạp của các tài liệu khoa học có thể ảnh hưởng đến hiệu suất của hệ thống, khiến cho việc trích xuất thông tin sai, không đầy đủ hoặc không liên quan.

 

Hệ thống trích xuất thông tin bán mở là sự kết hợp của cả hai hệ thống hẹp và mở. Thông tin được trích xuất chính xác, sau đó sử dụng hệ thống scattershot để lọc kết quả.

 

Nhóm nghiên cứu đã nhận thấy cân bằng độc đáo giữa độ chính xác và tính linh hoạt của hai kỹ thuật IE kể trên. Họ đã thử nghiệm trên kho dữ liệu 10.000 văn bản liên quan đến sinh học, và nhận thấy rằng, nó đạt được hiệu suất vượt trội, trích xuất thành công những thông tin quan trọng nhất trong đó.

 

Kruiper, một thành viên trong nhóm nghiên cứu cho biết: "Lọc các sự kiện bằng hệ thống scattershot giúp cải thiện chất lượng tổng thể, đồng thời giảm đáng kể lượng tài liệu thực tế. Cách tiếp cận kết hợp mà chúng tôi phát triển có thể xác định mối quan hệ trung tâm với độ chính xác cao, đồng thời xác định các yếu tố có liên quan chặt chẽ với nhau".

 

Mã của hệ thống IE được công bố trực tuyến và có thể truy cập trên trang GitHub của Kruiper. Nó có thể giúp ích cho các nhà nghiên cứu hoặc các kỹ sư để tìm các thông tin khoa học theo một chủ đề nào đó, ngoài lĩnh vực chuyên môn của họ, hoặc những người cần xem xét một lượng lớn các tài liệu nghiên cứu.

 

Diệu Huyền - CESTI, theo Techxplore.

Trở lại      In      Số lần xem: 72

[ Tin tức liên quan ]___________________________________________________
  • Hơn 120 quốc gia ký kết Hiệp ước Paris về biến đổi khí hậu
  • Một số giống đậu tương mới và mô hình chuyển đổi cơ cấu cây trồng trên đất lúa tại Đông Nam Bộ và Đồng Bằng Sông Cửu Long
  • Các nước cam kết chống biến đổi khí hậu
  • 12 giống hoa được công nhận bản quyền
  • Thảo luận việc quản lý nước theo cơ chế thị trường
  • Lượng nước ngầm trên Trái đất đạt 23 triệu kilômét khối
  • Sản xuất hồ tiêu thế giới: Hiện trạng và Triển vọng
  • Triển vọng tích cực cho nguồn cung ngũ cốc toàn cầu năm 2016
  • Cây trồng biến đổi gen với hai tỷ ha (1996-2015); nông dân hưởng lợi >150 tỷ usd trong 20 năm qua
  • Cơ hội cho gạo Việt
  • Việt Nam sẽ áp dụng cam kết TPP cho thêm 40 nước
  • El Nino có thể chấm dứt vào cuối tháng 6
  • Chi phí-hiệu quả của các chương trình bệnh động vật "không rõ ràng"
  • Xuất khẩu hồ tiêu: Gậy ông đập lưng ông
  • Đất có thể đóng vai trò quan trọng trong việc giảm lượng khí nhà kính
  • Quản lý và phát triển thương hiệu gạo Việt Nam
  • Những cách nổi bật để giải quyết những thách thức về hệ thống lương thực toàn cầu
  • Lập bản đồ các hộ nông dân trồng trọt trên toàn thế giới
  • Hỗ trợ chuyển đổi từ trồng lúa sang trồng ngô
  • Nếu không được kiểm soát, cỏ dại sẽ gây thiệt hại kinh tế tới hàng tỷ USD mỗi năm
Designed & Powered by WEBSO CO.,LTD