« Home « Kết quả tìm kiếm

Giải pháp quy hoạch quản lý dữ liệu hỗ trợ nông nghiệp thông minh


Tóm tắt Xem thử

- GIẢI PHÁP QUY HOẠCH QUẢN LÝ DỮ LIỆU HỖ TRỢ NÔNG NGHIỆP THÔNG MINH.
- Quy hoạch quản lý dữ liệu, data stewardship, nguyên lý FAIR, quản trị dữ liệu, chuẩn OGC, domain-based web service, web features service, kho dữ liệu, dữ liệu lớn.
- Đứng ở góc độ quản lý khoa học, có thể nhận thấy bài toán thu thập, quản lý, chia sẻ các nguồn dữ liệu cần thiết cho các nghiên cứu nông nghiệp đã trở nên bức thiết.
- là khối chịu ảnh hưởng trực tiếp bởi các văn bản quy phạm pháp luật trong lĩnh vực xây dựng nguồn dữ liệu mở.
- Ra quyết định dựa trên phân tích dữ liệu là nhu cầu căn bản của quản trị thông minh.
- Chẳng hạn, phần lớn các dữ liệu cơ bản như bản.
- dữ liệu về hệ thống sông ngòi, kênh rạch hiện chưa có đơn vị cung cấp chính thức.
- dữ liệu về hệ thống đập thủy lợi, đê điều càng khan hiếm hơn.
- Một ví dụ khác liên quan đến sự thiếu hụt dữ liệu về nguồn giống cây trồng cũng cần phải được nhanh chóng giải quyết.
- Do vậy, mục tiêu đầu tiên của bài viết này là đưa ra các đánh giá sơ bộ về hiện trạng quản lý dữ liệu tại Việt Nam, sẽ được trình bày cụ thể ở Mục 4..
- Bên cạnh đó, khái niệm chia sẻ dữ liệu đang được hiểu rất khác nhau của các bên liên quan..
- cung cấp dữ liệu thuộc tính như *.shp (của ESRI),.
- Quản trị dữ liệu.
- Quản trị dữ liệu (Data governance) được định nghĩa bao gồm các chính sách, thủ tục và nguyên tắc (bao gồm các tiêu chuẩn) chi phối dữ liệu của bạn..
- Quản trị dữ liệu đảm bảo độ tin cậy của dữ liệu và có cơ chế kiểm soát để các bên liên quan phải chịu.
- Có thể thấy, khía cạnh mà quản trị dữ liệu quan tâm là các yếu tố mang tính cơ chế.
- Để các cơ chế của quản trị dữ liệu trở thành hiện thực, đòi hỏi nhà quản lý phải áp dụng nội hàm thứ hai là quản lý dữ liệu (data stewardship) (Teperek et al., 2018).
- Quản lý dữ liệu được định nghĩa như cách thức triển khai các chính sách, thủ tục và nguyên tắc mà quản trị dữ liệu quy định.
- Quản lý dữ liệu quan tâm đến ba tiến trình hợp tác, nối kết và chia sẻ dữ liệu (Datavault, n.d.
- Siêu dữ liệu đóng vai trò rất quan trọng trong việc xác định ngữ nghĩa (semantic) của dữ liệu.
- Nguyên lý FAIR trong chia sẻ dữ liệu Các nguyên lý FAIR(Lamprecht et al., 2020;.
- Trong các nguyên lý này, bài viết sẽ đi sâu vào phân tích các yêu cầu về mã định danh tài nguyên dữ liệu bằng DOI (Digital Object Identifier) hoặc URL/URI (nguyên lý F), siêu dữ liệu (metadata) (nguyên lý F).
- các giao thức mở, chuẩn dữ liệu phổ biến (nguyên lý A1.1).
- các định dạng dữ liệu đa dạng có thể truy vấn như JSON, TURTLE, RDF/XML, CSV.
- và cuối cùng, dữ liệu cần được liên kết với xuất xứ chi tiết (nguyên lý R1.2)..
- Một số nguồn dữ liệu mở hữu ích có hỗ trợ nguyên lý FAIR/O (FAIR/Dữ liệu mở)..
- STT Nguồn dữ liệu Mô tả nguồn dữ liệu Địa chỉ URL Hỗ trợ.
- Nguồn dữ liệu không gian miễn phí của dự án DIVA-GIS.
- Dữ liệu mở 2 USGS Data Dữ liệu viễn thám và Landsat của.
- Nền tảng quy mô toàn cầu hỗ trợ truy vấn, phân tích và dữ liệu khoa học trái đất của Google.
- Cung cấp đa dạng các RESTful API cho phép truy vấn và xử lý dữ liệu trực tuyến liên quan đến các ứng dụng của Google.
- Kho dữ liệu về giám sát môi trường và vận động của Đồng bằng sông Cửu Long và lưu vực sông Mê Kông.
- Dịch vụ dữ liệu khoa học thuộc Thư viện Nông nghiệp Quốc gia (Mỹ).
- Kho dữ liệu mở của Viện nghiên.
- Kho dữ liệu mở của Đại học.
- Phân loại học, Thực thể học và Dữ liệu liên kết.
- cho phép nhìn nhận các đối tượng theo hệ thống, rất hữu ích cho việc quản lý dữ liệu có tính hệ thống..
- Chính vì vậy, phân loại học được khuyến cáo trong nguyên lý I2 của FAIR, và trở thành một trong các tiêu chuẩn quan trọng của quản lý dữ liệu.
- Khái niệm thực thể học được đề cập ở đây vì nó liên quan trực tiếp đến khái niệm dữ liệu liên kết (Linked Data) (Berners-Lee, 2009.
- Các tập dữ liệu (dataset) hiện nay cũng cần được quản lý theo cách thức tương tự, nhằm hỗ trợ nhận dạng và tái sử dụng ở bất cứ đâu..
- Bảng 2 trình bày một số nguồn dữ liệu quốc tế về sinh học, nông nghiệp và thủy sản có giá trị cao cần được tham khảo để áp dụng cho nông nghiệp Việt Nam.
- Các nguồn dữ liệu này được quản lý dựa trên nguyên lý phân loại học..
- Các nguồn dữ liệu phân loại học liên quan đến sinh học, nông nghiệp và thủy sản..
- STT Tên nguồn Mô tả dữ liệu Địa chỉ URL.
- Dữ liệu mở toàn cầu về nông nghiệp và.
- Dữ liệu mở nối kết (Linking Open Data – LOD) là chủ đề rộng và cần được quan tâm nghiên cứu trong việc quy hoạch quản lý dữ liệu ở Việt Nam..
- Thuật ngữ này kết hợp hai thuộc tính quan trọng, gồm dữ liệu mở (Open Data) và Dữ liệu nối kết (Linked Data).
- tả từ vựng cho các tập dữ liệu.
- Dữ liệu liên kết đòi hỏi phải sử dụng các tiêu chuẩn kỹ thuật.
- dữ liệu OData v4 Open Data Protocol version.
- 2.12 Bộ phần tử siêu dữ liệu Dublin Core.
- Định dạng trao đổi dữ liệu mô tả đối tượng dạng kịch bản JavaScript.
- VAI TRÒ CỦA NGUỒN DỮ LIỆU.
- Nguồn dữ liệu nông nghiệp.
- Các dữ liệu phục vụ nông nghiệp có thể phân thành ba nhóm chính liên quan đến tính chất và cách thức tác động của chúng đến cộng đồng nghiên cứu:.
- Nhóm dữ liệu về sản xuất, canh tác, chẳng hạn:.
- Nhóm dữ liệu về thị trường, chẳng hạn: Năng lực thu mua và xuất khẩu.
- Như đã trình bày bên trên, khái niệm thông minh trong nghiên cứu nông nghiệp được xây dựng trên 03 cấp độ khác nhau của phân tích dữ liệu.
- Trong cả 03 cấp độ phân tích này, quy trình phân tích dữ liệu thông minh có những nét tương đồng, bao gồm 06 bước (Hình 1).
- các định dạng dữ liệu đa dạng có thể truy vấn như JSON, TURTLE, RDF/XML hay CSV (nguyên lý I1), khả năng sử dụng các bộ từ vựng chuẩn mực (hoặc cao hơn là sử dụng phân loại học) trong quản lý dữ liệu (nguyên lý I2).
- và cuối cùng, dữ liệu cần được liên kết với xuất xứ chi tiết (nguyên tắc R1.2).
- Quy trình phân tích dữ liệu thông minh 4.
- DỮ LIỆU TẠI VIỆT NAM.
- Hiện trạng quản lý dữ liệu tại Việt Nam được xem xét đánh giá trên ba khía cạnh: (1) Liên quan đến định hướng chính sách tổ chức, quản lý và chia sẻ về dữ liệu.
- và (3) Năng lực khai thác các nguồn dữ liệu mở..
- Thứ nhất, xét về định hướng chính sách tổ chức, quản lý và chia sẻ về dữ liệu, có thể nói Chính phủ Việt Nam rất quan tâm đến vấn đề quản trị nguồn dữ liệu quốc gia ở tầm vĩ mô.
- Nghị định số 47/2020/NĐ-CP về quản lý, kết nối và chia sẻ dữ liệu số của cơ quan nhà nước..
- Hồ Chí Minh 8 và Cổng dữ liệu mở Đà Nẵng 9 .
- Cổng dịch vụ dữ liệu mở của tỉnh.
- số hóa dữ liệu xây dựng chính quyền điện tử tỉnh Sóc Trăng ngày 13/7/2021.
- Tuy nhiên, nếu so sánh với các hệ thống quản lý dữ liệu FAIR, các cổng dữ liệu mở bên trên vẫn còn nhiều hạn chế và cần được cải tiến.
- Bên cạnh đó, phần lớn nguồn dữ liệu cấp tỉnh, hoặc cấp quốc gia hiện nay là các dữ liệu đã qua xử lý (thông thường là dữ liệu thống kê, tức là qua cấp độ Phân tích mô tả), trong khi cộng đồng nghiên cứu cần hơn nguồn dữ liệu cơ sở (hay dữ liệu thô).
- Một minh chứng cụ thể cho vấn đề này là khi tiếp cận các nguồn dữ liệu về khí tượng thủy văn.
- Còn lại, rất nhiều trung tâm chức năng cấp quốc gia, cấp vùng không có cơ chế chia sẻ dữ liệu chính thức cho cộng đồng nghiên cứu..
- Thứ ba, liên quan đến năng lực khai thác các nguồn dữ liệu mở, đặc biệt các nguồn dữ liệu đã hỗ trợ FAIR.
- Đây là một số gợi ý để các trung tâm dữ liệu ở Việt Nam có thể học hỏi để có thể đóng góp tốt hơn vào nguồn dữ liệu đang thiếu hụt trong lĩnh vực nông nghiệp..
- MÔ HÌNH QUY HOẠCH QUẢN LÝ DỮ LIỆU THEO NGUYÊN LÝ FAIR.
- Dựa trên các phân tích và đánh giá về thực trạng quản lý, chia sẻ dữ liệu tại Việt Nam nêu trên, Mô hình Quy hoạch Quản lý dữ liệu (DMP) được đề xuất nhằm áp dụng cho hai khối cơ quan chức năng liên quan đến quản lý dữ liệu nông nghiệp tại Đồng bằng Sông Cửu Long:.
- Khối chính phủ: Nhóm các cơ quan thuộc khối chính phủ, bao gồm các trung tâm dữ liệu cấp quốc gia, cấp vùng hoặc cấp tỉnh/thành..
- Đây là nhóm công nghệ đòi hỏi sự am hiểu sâu về CNTT, có thể được cài đặt bên trong các trung tâm dữ liệu lớn và tập trung.
- Đối với hệ thống này, cách thức cung cấp dữ liệu cho cộng đồng nên dựa trên việc cung cấp 03 nhóm công nghệ:.
- Các hệ truy vấn dữ liệu Impala/Hive cho các hệ sinh thái dữ liệu lớn Apache Hadoop..
- Dịch vụ Dữ liệu không gian (Spatial Data):.
- Trong nhóm này, các chuẩn dữ liệu của tổ chức OGC (OGC Standard, 2021) được khuyến cáo sử dụng.
- Cụ thể hơn các các dịch vụ cung cấp dữ liệu bản đồ, đặc biệt là phần mềm GeoServer (Geoserver.org, n.d.
- GeoServer cũng chính thức tuyên bố tuân thủ nguyên lý FAIR trong các quy trình và chính sách quản lý dữ liệu của mình.
- Ở khối chính phủ, như đã phân tích, đã bắt đầu hình thành các trung tâm dữ liệu mở quốc gia đang phục vụ cho xu hướng này..
- Dịch vụ Dữ liệu ấn phẩm khoa học (OJS):.
- Ấn phẩm khoa học là yếu tố đặc biệt quan trọng trong nghiên cứu khoa học, do vậy các nguồn dữ liệu về thư viện học thuật liên quan đến ấn phẩm khoa học là rất cần thiết.
- Hình 2 sơ đồ hóa toàn bộ giải pháp Quy hoạch Quản lý Dữ liệu (DMP) hỗ trợ nông nghiệp thông minh mà nghiên cứu này đề xuất, trong đó bao gồm các nhóm dịch vụ và ứng dụng cần phải có đối với hai Khối cơ quan: Khối chính phủ và Khối nghiên cứu, học thuật..
- Giải pháp Quy hoạch Quản lý Dữ liệu (DMP) hỗ trợ nông nghiệp thông minh Trong mô hình đề xuất, mặc dù Khối nghiên cứu,.
- Đối với việc tổ chức và phân loại dữ liệu, như đề cập trong Mục 3, cần phân chia dữ liệu thành 03.
- nhóm độc lập, bao gồm: (1) Nhóm dữ liệu về điều kiện tự nhiên và quy hoạch, (2) Nhóm dữ liệu về sản xuất, canh tác và (3) Nhóm dữ liệu về thị trường..
- Nói cách khác, Quy hoạch Quản lý Dữ Liệu (DMP) được trình bày trong Hình 2 là một giải pháp mang tính tổng thể.
- Tóm lại, bài viết hướng đến một đề xuất một Quy hoạch quản lý dữ liệu (DMP) mang tính tổng thể, áp dụng trong lĩnh vực nông nghiệp tuân thủ các nguyên lý FAIR (CÔNG BẰNG).
- Trong quy trình phân tích dữ liệu, hai bước (2) và (3), Xác định nguồn dữ liệu và Thu thập và chuẩn bị dữ liệu, được xác định là yếu tố khách quan (đối với chuyên gia) ảnh hưởng đến chất lượng phân tích dữ liệu.
- Trong mô hình đề xuất, vai trò của việc áp dụng DMP được nhấn mạnh cho các cơ quan Khối chính phủ, đặc biệt là các cơ quan quản lý dữ liệu nông nghiệp và các lĩnh vực liên quan đến nông nghiệp (Như phân tích trong Mục 3.1).
- Một là, trong kiến trúc Đại học thông minh mà Trường đang xây dựng, cần lưu ý nguyên lý FAIR trong việc cung cấp và chia sẻ dữ liệu từ Trung tâm Dữ liệu của Trường..
- Hiện tại, một số đơn vị đã vận hành dịch vụ này nhưng chủ yếu để phát triển các ứng dụng WebGIS (phục vụ nhu cầu cục bộ), chứ chưa phục vụ nhu cầu quản lý và chia sẻ dữ liệu..
- Quản lý dữ liệu không gian trong các hệ thống thông tin nền web: các vấn đề phát sinh và giải pháp chuẩn hóa