You are on page 1of 7

Tổng quan về dữ liệu lớn… Nghiên cứu – Trao đổi

TỔNG QUAN VỀ DỮ LIỆU LỚN


ThS.Nguyễn Văn Đoàn1
KS.Nguyễn Công Hoan2

Trước đây, chúng ta mới chỉ biết đến dữ liệu có cấu trúc (structure data), ngày nay, với sự kết
hợp của dữ liệu và internet, đã xuất hiện một dạng khác của dữ liệu - Big data (dịch là “dữ liệu
lớn”). Dữ liệu này có từ các nguồn như: hồ sơ hành chính, giao dịch điện tử, dòng trạng thái
(status), chia sẻ hình ảnh, bình luận, nhắn tin... của chính chúng ta, nói cách khác chúng là dữ liệu
được sản sinh qua quá trình chia sẻ thông tin trực tuyến liên tục của người sử dụng. Nhận thấy vai
trò và lợi ích mà dữ liệu lớn đem lại, cộng đồng thống kê quốc tế đã và đang có rất nhiều dự án
nghiên cứu, ứng dụng dữ liệu lớn. Để cung cấp cái nhìn tổng quan về dữ liệu lớn cho quý độc giả,
bài viết này giới thiệu tóm tắt những nét chính cũng như những cơ hội và thách thức mà dữ liệu lớn
mang lại.
Khái niệm, đặc trƣng của dữ liệu lớn
và sự khác biệt với dữ liệu truyền thống
- Dữ liệu lớn (Big data) là một thuật ngữ
chỉ bộ dữ liệu lớn hoặc phức tạp mà các
phương pháp truyền thống không đủ các ứng
dụng để xử lý dữ liệu này [1].
Dữ liệu lớn được hình thành chủ yếu từ
các nguồn: (1) Dữ liệu hành chính (phát sinh
từ chương trình của một tổ chức, có thể là dụ theo dõi dữ liệu từ điện thoại di động, GPS;
chính phủ hay phi chính phủ). Ví dụ, hồ sơ y tế (5) Dữ liệu từ các hành vi, ví dụ như tìm kiếm
điện tử ở bệnh viện, hồ sơ bảo hiểm, hồ sơ trực tuyến về một sản phẩm, một dịch vụ hay
ngân hàng...; (2) Dữ liệu từ hoạt động thương bất kỳ loại thông tin khác, trang xem trực
mại (phát sinh từ các giao dịch giữa hai thực tuyến; (6) Dữ liệu từ các thông tin ý kiến trên
thể). Ví dụ, các giao dịch thẻ tín dụng, giao các phương tiện thông tin xã hội.
dịch trên mạng, bao gồm cả từ các thiết bị di
Dữ liệu lớn có 5 đặc trưng cơ bản như
động; (3) Dữ liệu từ các thiết bị cảm biến như
sau (mô hình 5Vs về dữ liệu lớn)3:
hình ảnh vệ tinh, cảm biến đường, cảm biến
khí hậu; (4) Dữ liệu từ các thiết bị theo dõi, ví

1
Viện trưởng Viện Khoa học Thống kê
2
Trung tâm Thông tin khoa học thống kê, Viện Khoa học Thống kê
3
Mô hình 5Vs do Gartner xây dựng. Gartner là công ty nghiên cứu và tư vấn về công nghệ thông tin hàng đầu thế giới
do một người Mỹ tên là Gideon Gartner sáng lập năm 1979. 5Vs: Khối lượng dữ liệu (Volume); Tốc độ (Velocity); Giá
trị (Value); Độ tin cậy/chính xác (Veracity); Đa dạng (Variety).

SỐ 04 – 2015 7

7
Nghiên cứu – Trao đổi Tổng quan về dữ liệu lớn…

(1) Khối lượng dữ liệu (Volume): Đây là (Social Media) và mạng xã hội (Social Network)

đặc điểm tiêu biểu nhất của dữ liệu lớn, khối ngày nay và sự gia tăng mạnh mẽ tính tương
lượng dữ liệu rất lớn. Kích cỡ của Big Data tác và chia sẻ của người dùng Mobile làm cho
đang từng ngày tăng lên, và tính đến năm bức tranh xác định về độ tin cậy và chính xác
2012 thì nó có thể nằm trong khoảng vài chục của dữ liệu ngày một khó khăn hơn. Bài toán
terabyte cho đến nhiều petabyte (1 petabyte = phân tích và loại bỏ dữ liệu thiếu chính xác và
1024 terabyte) chỉ cho một tập hợp dữ liệu. Dữ nhiễu đang là tính chất quan trọng của
liệu truyền thống chúng ta có thể lưu trữ trên BigData.
các thiết bị đĩa mềm, đĩa cứng. Nhưng với dữ
(5) Giá trị (Value): Giá trị là đặc điểm
liệu lớn sẽ sử dụng công nghệ “đám mây” mới
quan trọng nhất của dữ liệu lớn, vì khi bắt đầu
có khả năng lưu trữ được dữ liệu lớn.
triển khai xây dựng dữ liệu lớn thì việc đầu tiên
(2) Tốc độ (Velocity): Tốc độ có thể hiểu chúng ta cần phải làm đó là xác định được giá
theo 2 khía cạnh: (a) Khối lượng dữ liệu gia trị của thông tin mang lại như thế nào, khi đó
tăng rất nhanh (mỗi giây có tới 72.9 triệu các chúng ta mới có quyết định nên triển khai dữ
yêu cầu truy cập tìm kiếm trên web bán hàng liệu lớn hay không. Nếu chúng ta có dữ liệu lớn
của Amazon); (b) Xử lý dữ liệu nhanh ở mức mà chỉ nhận được 1% lợi ích từ nó, thì không
thời gian thực (real-time), có nghĩa dữ liệu nên đầu tư dữ liệu lớn. Kết quả dự báo chính
được xử lý ngay tức thời ngay sau khi chúng xác thể hiện rõ nét nhất về giá trị của dữ liệu
phát sinh (tính đến bằng mili giây). Các ứng lớn mang lại. Ví dụ, từ khối dữ liệu phát sinh
dụng phổ biến trên lĩnh vực Internet, Tài trong quá trình khám, chữa bệnh sẽ giúp dự
chính, Ngân hàng, Hàng không, Quân sự, Y tế báo về sức khỏe được chính xác hơn, sẽ giảm
– Sức khỏe như hiện nay phần lớn dữ liệu lớn được chi phí điều trị và các chi phí liên quan
được xử lý real-time. Công nghệ xử lý dữ liệu đến y tế.
lớn ngày một tiên tiến cho phép chúng ta xử lý
Dữ liệu lớn khác với dữ liệu truyền
tức thì trước khi chúng được lưu trữ vào cơ sở
thống (ví dụ, kho dữ liệu - Data Warehouse) ở
dữ liệu.
4 điểm: Dữ liệu đa dạng hơn; lưu trữ dữ liệu
(3) Đa dạng (Variety): Đối với dữ liệu lớn hơn; truy vấn nhanh hơn; độ chính xác
truyền thống chúng ta hay nói đến dữ liệu có cao hơn.
cấu trúc, thì ngày nay hơn 80% dữ liệu được
(1) Dữ liệu đa dạng hơn: Khi khai thác
sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh,
dữ liệu truyền thống (thường là dữ liệu có cấu
vi deo, bài hát, dữ liệu từ thiết bị cảm biến vật
trúc), chúng ta thường phải trả lời các câu hỏi:
lý, thiết bị chăm sóc sức khỏe…). Big Data cho
Dữ liệu lấy ra kiểu gì? định dạng dữ liệu như
phép liên kết và phân tích nhiều dạng dữ liệu
thế nào? Đối với dữ liệu lớn, không phải trả lời
khác nhau. Ví dụ, với các comments/post của
các câu hỏi trên. Hay nói khác, khi khai thác,
một nhóm người dùng nào đó trên Facebook
phân tích dữ liệu lớn chúng ta không cần quan
với thông tin video được chia sẻ từ Youtube và
tâm đến kiểu dữ liệu và định dạng của chúng;
Twitter.
điều quan tâm là giá trị mà dữ liệu mang lại có
(4) Độ tin cậy/chính xác (Veracity): Một đáp ứng được cho công việc hiện tại và tương
trong những tính chất phức tạp nhất của lai hay không.
BigData là độ tin cậy/chính xác của dữ liệu. Với (2) Lưu trữ dữ liệu lớn: Lưu trữ dữ liệu
xu hướng phương tiện truyền thông xã hội truyền thống vô cùng phức tạp và luôn đặt ra
8 SỐ 04– 2015

8
Tổng quan về dữ liệu lớn… Nghiên cứu – Trao đổi
câu hỏi lưu thế nào: dung lượng kho lưu trữ Hình trên cho thấy Tổng thống Mỹ
bao nhiêu là đủ? gắn kèm với câu hỏi đó thì chi Obama đã sử dụng dữ liệu dữ liệu lớn để phục
phí đầu tư sẽ là rất lớn. Công nghệ lưu trữ dữ vụ cho cuộc tranh cử Tổng thống của mình.
liệu lớn hiện nay đã phần nào có thể giải quyết Ông xây dựng một đội ngũ nhân viên chuyên
được vấn đề trên nhờ những công nghệ lưu trữ đi thu thập thông tin và phân tích dữ liệu thu
đám mây, phân phối lưu trữ dữ liệu phân tán được trong dự án triển khai về dữ liệu lớn. Đội
và có thể kết hợp các dữ liệu phân tán lại với ngũ nhân viên này thu thập tất cả thông tin về
nhau một cách chính xác và xử lý nhanh. người dân ở các khu vực, sau đó phân tích và
chỉ ra một số thông tin quan trọng về người
(3) Truy vấn dữ liệu nhanh hơn: dữ liệu
dân Mỹ như: Thích đọc sách gì, thích mua loại
lớn được cập nhật liên tục, trong khi đó kho dữ
thuốc gì, thích sử dụng phương tiện gì… Thậm
liệu truyền thống thì lâu lâu mới được cập nhật
chí còn biết được cả thông tin về người đó đã
và trong tình trạng không theo dõi thường
bỏ phiếu tín nhiệm ai ở lần bầu cử trước. Trên
xuyên, gây ra tình trạng lỗi cấu trúc truy vấn
cơ sở những thông tin này, Obama đã đưa ra
dẫn đến không tìm kiếm được thông tin đáp
kế hoạch vận động phù hợp, giúp ông tái đắc
ứng theo yêu cầu.
cử Tổng thống lần 2 của nước Mỹ.
(4) Độ chính xác cao hơn: dữ liệu lớn khi
Ngoài ra một số ứng dụng khác trong
đưa vào sử dụng thường được kiểm định lại dữ
lĩnh vực chính trị mà dữ liệu lớn được áp dụng
liệu với những điều kiện chặt chẽ, số lượng
như: Hệ thống chính phủ điện tử; phân tích
thông tin được kiểm tra thông thường rất lớn,
quy định và việc tuân thủ quy định; phân tích,
và đảm bảo về nguồn lấy dữ liệu không có sự
giám sát, theo dõi và phát hiện gian lận, mối
tác động của con người vào thay đổi số liệu
đe dọa, an ninh mạng.
thu thập.
(2) Ứng dụng dữ liệu lớn trong giao thông
Ứng dụng dữ liệu lớn trong các
lĩnh vực
Dữ liệu lớn đã được ứng dụng trong
nhiều lĩnh vực như: hoạt động chính trị; giao
thông; y tế; thể thao; tài chính; thương mại;
thống kê... dưới đây là một số ví dụ về ứng
dụng dữ liệu lớn.
(1) Ứng dụng dữ liệu lớn trong hoạt
động chính trị
Sử dụng số liệu CDR trong quá khứ để
ước lượng các dòng giao thông trong thành
phố vào các giờ cao điểm, từ đó có những kế
hoạch phân luồng giao thông chi tiết, hợp lý
giúp giảm thiểu kẹt xe. Ngoài ra còn đưa ra
thông tin cho người tham gia giao thông được
biết nếu muốn đi từ nơi này đến nơi khác thì
nên đi vào giờ nào để tránh kẹt xe, hoặc đi
đường nào là ngắn nhất v.v... Ngoài ra dữ liệu
SỐ 04 – 2015 9

9
Nghiên cứu – Trao đổi Tổng quan về dữ liệu lớn…

lớn còn giúp phân tích định vị người dùng đã đưa ra những điểm bất hợp lý trong cấu

thiết bị di động, ghi nhận chi tiết cuộc gọi trúc của đội tuyển Đức, từ đó giúp cho đội
trong thời gian thực; và giảm thiểu tình trạng tuyển Đức khắc phục được điểm yếu và đã
ùn tắc giao thông. dành được World cup 2014.
(3) Ứng dụng dữ liệu lớn trong y tế (5) Ứng dụng dữ liệu lớn trong tài chính
Từ những dữ liệu chính xác, kịp thời thu
thập được thông qua các giao dịch của khách
hàng, tiến hành phân tích, xếp hạng và quản lý
các rủi ro trong đầu tư tài chính, tín dụng.
(6) Ứng dụng dữ liệu lớn trong thương mại
Trong thương mại dữ liệu lớn giúp cho
chúng ta thực hiện được một số công việc sau:
Phân khúc thị trường và khách hàng; phân tích
Trong y học các bác sĩ dựa vào số liệu
hành vi khách hàng tại cửa hàng; tiếp thị trên
trong các bệnh án để đưa ra dự đoán về nguy
nền tảng định vị; phân tích tiếp thị chéo kênh,
cơ mắc bệnh. Đồng thời cũng đưa ra được xu
tiếp thị đa kênh; quản lý các chiến dịch tiếp thị
hướng lây lan của bệnh. Ví dụ, ứng dụng
và khách hàng thân thiết; So sánh giá; Phân
Google Flu Trend là một trong những ứng dụng
tích và quản lý chuỗi cung ứng; Phân tích hành
thành công của Google ứng dụng này dựa trên
từ khóa tìm kiếm ở một khu vực nào đó, sau đó vi, thói quen người tiêu dùng.
bộ máy phân tích của google sẽ phân tích và (7) Ứng dụng dữ liệu lớn trong thống kê
đối chiếu kết quả tìm kiếm đó, sau cùng là đưa
ra dự báo về xu hướng dịch cúm tại khu vực
đó. Qua đó cho biết tình hình cúm tại khu vực
đó sẽ diễn ra như thế nào để đưa ra các giải
pháp phòng tránh. Những kết quả mà Google
Flu Trend đưa ra, hoàn toàn phù hợp với báo
cáo của Tổ chức y tế thế giới WHO về tình hình
bệnh cúm tại các khu vực đó.
(4) Ứng dụng dữ liệu lớn trong thể thao
Phân tích mô hình hệ thống cấu trúc sơ
đồ chiến thuật của đội tuyển Đức (hình dưới)
Một nghiên cứu thu thập thông tin qua
các phương tiện truyền thông ở Hà Lan đã
thống kê được nội dung các tin nhắn của người
dân Hà Lan (hình trên), trong đó có đến 50%
số tin nhắn vô nghĩa. Số liệu này cho thấy kinh
phí đã chi ra không đem lại lợi ích cho người
dân cũng như xã hội Hà Lan, Chính phủ cần
phải có những điều chỉnh về hoạt động này.

10 SỐ 04– 2015

10
Tổng quan về dữ liệu lớn… Nghiên cứu – Trao đổi
Ủy ban Thống kê Liên hợp quốc đang triển hút được sự quan tâm của nhà tổ chức và đại
khai nhiều hoạt động liên quan đến dữ liệu lớn biểu tham dự, như: Hội nghị của Giám đốc các
với thống kê chính thức. Cơ quan thống kê quốc gia DGINS 213 ở The
Hague; Hội nghị Chất lượng Thống kê châu Âu
Dữ liệu lớn và thống kê chính thức
2014 (Q2014) ở Vienna; Hội nghị của Hiệp hội
Mối quan tâm của thống kê chính thức Quốc tế về Thống kê chính thức 2014 (IAOS
đối với dữ liệu lớn: Nhận thấy những lợi ích 2014) ở Đà Nẵng; Đại hội Thống kê thế giới
(giảm thời gian và chi phí sản xuất thông tin lần thứ 60 tại Rio de Janeiro. Đặc biệt, năm
thống kê) và những thách thức của dữ liệu lớn 2014, Ủy ban Thống kê Liên hợp quốc thành
đối với thống kê chính thức, Ủy ban Thống kê lập Nhóm công tác toàn cầu về dữ liệu lớn.
Liên hợp quốc cũng như các tổ chức thống kê
khu vực và cơ quan thống kê quốc gia của một
Nhóm công tác toàn cầu về dữ liệu lớn:
Nhận thấy những lợi ích và thách thức của dữ
số nước đã triển khai hàng loạt các hoạt động
liệu lớn đối với thống kê chính thức, tại cuộc
về dữ liệu lớn đối với thống kê chính thức. Cụ
họp lần thứ 45 (tháng 3/2014), Ủy ban thống
thể, Hội nghị cấp cao về Hợp lý hóa các dịch
kê Liên hợp quốc đã thành lập Nhóm công tác
vụ và sản phẩm thống kê được tổ chức năm
toàn cầu (Global Working Group - GWG) về dữ
20124, đã chỉ ra những cơ hội và thách thức
liệu lớn, nhằm nghiên cứu, giải quyết các vấn
của dữ liệu lớn với thống kê chính thức. Dự án
đề liên quan đến dữ liệu lớn như: Phương
dữ liệu lớn5 được hình thành, một trong các
pháp luận; chất lượng; công nghệ; truy cập dữ
sản phẩm của Dự án là Báo cáo về “Dữ liệu lớn
liệu; pháp luật; bảo mật; quản lý và tài chính;
lớn như thế nào?” đã cho thấy vai trò tiềm
phân tích chi phí - lợi ích về dữ liệu lớn…
năng của dữ liệu lớn đối với thống kê chính
thức, đặc biệt là những thách thức và yêu cầu Ngày 31/10/2014, phiên họp đầu tiên
xét trên phương diện các phương pháp thống của GWG đã khẳng định việc sử dụng dữ liệu
kê bao gồm chất lượng, công nghệ thông tin, lớn cho các thống kê chính thức là một nghĩa
năng lực và kĩ năng của đội ngũ nhân viên. Hội vụ đối với cộng đồng thống kê dựa trên các
thảo về dữ liệu lớn của Thống kê châu Âu tại nguyên tắc cơ bản để đáp ứng sự kỳ vọng của
Rome (2014); Hội nghị quốc tế về dữ liệu lớn xã hội đối với các sản phẩm thống kê và cải
trong Thống kê chính thức tại Bắc Kinh (2014); thiện cách thức làm việc đạt hiệu quả hơn. Tại
Hội thảo vệ tinh UNECE NTTS 2015 về dữ liệu cuộc họp này, GWG đã hình thành 8 tổ công
lớn ở Brussels (2015). tác (task teams) theo các chủ đề: Vận động và
truyền thông; liên kết dữ liệu lớn và các Mục
Một số báo cáo về dữ liệu lớn được trình
tiêu Phát triển bền vững; tiếp cận và quan hệ
bày trong các sự kiện quốc tế khác đang thu
đối tác; đào tạo, xây dựng kỹ năng và năng lực
thống kê; dữ liệu từ điện thoại di động; ảnh vệ
4
UNECE (2013) what does “big data” mean for official tinh; dữ liệu từ các phương tiện truyền thông
statistic? Report of the Hight-level Group for the xã hội. Các Tổ công tác đã khẩn trương triển
Modemisation of Statistical Production and Services
(HLG). khai thực hiện nhiệm vụ và đã đưa ra một số
http://www1.unece.org/stat/platform/display/hlgbas kết quả nghiên cứu bước đầu.
5
UNECE (2014a) final project proposal: The rol of Big Một số kết quả nghiên cứu bước đầu về
data in the Modemisation of Statistical Production.
http://www1.unece.org/stat/platform/display/hlgbas. dữ liệu lớn đối với thống kê chính thức: Mặc

SỐ 04 – 2015 11

11
Nghiên cứu – Trao đổi Tổng quan về dữ liệu lớn…

dù mới được hình thành trong vòng một năm - Tổ chức một số cuộc hội thảo quốc tế …
nay, nhưng Nhóm công tác toàn cầu về dữ liệu và khu vực về dữ liệu lớn với thống kê chính
lớn của Ủy ban Thống kê Liên hợp quốc đã thức sẽ được tổ chức vào cuối năm 2015, như:
công bố một số kết quả nghiên cứu về dữ liệu Hội nghị toàn cầu lần thứ hai về dữ liệu lớn đối
lớn đối với thống kê chính thức như: Các Cơ với thống kê chính thức do Ủy ban Thống kê
quan Thống kê Quốc gia (NSOs) có thể tận Liên hợp quốc sẽ tổ chức tại Abu Dhabi, Tiểu
dụng nguồn dữ liệu mới và phương thức thu vương quốc Ả rập Thống nhất, từ ngày 20-
thập như thế nào? Chính phủ điện tử - Thống 22/10/20156; Hội nghị IASC-ARS7 được tổ chức
kê điện tử - Làm thế nào để các nhà thống kê tại Singapore từ 17-19/12/2015 với chủ đề
đưa chúng vào trung tâm của chuyển đổi chính “Toán Thống kê: Cơ hội và thách thức với Dữ
quyền thông qua Khoa học dữ liệu; Suy luận dữ liệu lớn”.
liệu lớn và mô hình cho thống kê chính thức, - Cơ quan thống kê quốc gia của một số
với ứng dụng của phân tích hình ảnh vệ tinh; nước đang tập trung nghiên cứu dữ liệu lớn với
Sử dụng dữ liệu lớn trong thống kê chính; dữ thống kê chính thức như: Australia,
liệu lớn và thống kê chính thức – Thách thức Bangladesh, Cameroon, China, Colombia,
của dữ liệu lớn trong Hệ thống Thống kê quốc Denmark, Egypt, Indonesia, Italy, Mexico,
gia; Quyền riêng tư, bảo mật và dữ liệu lớn; Morocco, Netherlands, Oman, Pakistan,
Thống kê trong thời đại thách thức hay cơ hội Philippines, Tanzania, USA. Một số tổ chức
của dữ liệu lớn; Sự hợp nhất dữ liệu không gian quốc tế như: UNSD, UNECE, UNESCAP, UN
và thời gian cho dữ liệu lớn và Ứng dụng của Global Pulse, ITU, OECD, World Bank,
nó trong vệ tinh viễn thám. Eurostat, GCC-stat. Đặc biệt Google đã và
Một số ứng dụng dữ liệu lớn trong thống đang nghiên cứu mối liên hệ và điều tra thông
kê chính thức như: Thống kê du lịch (Dữ liệu qua việc sử dụng dữ liệu lớn trong hệ thống
định vị của thiết bị di động trong công tác của mình.
thống kê du lịch); thống kê sử dụng công nghệ Tóm lại
thông tin và truyền thông; thống kê giá; thống
Dữ liệu lớn là một trong các chủ đề được
kê thị trường lao động; thống kê vận tải; tổng
quan tâm tại WSC lần thứ 60. Dữ liệu lớn
điều tra nông nghiệp và các cuộc điều tra ở
mang lại nhiều lợi ích, nhưng cũng có nhiều
một số lĩnh vực khác.
thách thức khi triển khai, sử dụng dữ liệu lớn
Một số hoạt động tiếp theo: nói chung và dữ liệu lớn với thống kê chính
- Nhóm công tác toàn cầu về dữ liệu lớn thức nói riêng.
của Ủy ban Thống kê Liên hợp quốc tiếp tục (Xem tiếp trang 6)
nghiên cứu và ứng dụng dữ liệu lớn trong
thống kê chính thức. Đặc biệt tập trung vào
6
các chủ đề như: Vận động và truyền thông về Chủ đề cuộc hội thảo này là “Moving from examples to
guidelines” (tạm dịch là “Chuyển từ các ví dụ đến hướng
dữ liệu lớn; liên kết dữ liệu lớn với các Mục tiêu dẫn thực hành”), nhằm thúc đẩy sự phát triển của Big
Phát triển bền vững; đào tạo, xây dựng các kỹ data thêm một bước nữa.
năng và năng lực; các thách thức đối với dữ 7
Cuộc Hội thảo này do Hiệp hội quốc tế về Toán thống
liệu lớn… kê tổ chức.

12 SỐ 04– 2015

12
Nghiên cứu – Trao đổi Một số nội dung sửa đổi, bổ sung…

liên quan nghiên cứu, tìm hiểu về dữ liệu lớn nghiệp vụ thống kê chuyên ngành. …
và dữ liệu mở để có đề xuất nội dung, phạm
Bảy là, Đề nghị Tổng cục giao Vụ Thống
vi, lộ trình sử dụng các nguồn dữ liệu này phục
kê nước ngoài và Hợp tác quốc tế liên hệ với
vụ công tác thống kê khi điều kiện kinh tế - xã
Cơ quan Thống kê Trung ương Palextin để bàn
hội ở nước ta cho phép.
việc hợp tác song phương giữa hai cơ quan
Sáu là, Đề nghị Tổng cục giao Vụ thống kê.
Phương pháp chế độ Thống kê và Công nghệ
Tám là, Đề nghị Tổng cục giao Vụ
thông tin chủ trì, phối hợp Trung tâm Tin học
Thống kê Nông, Lâm nghiệp và Thủy sản làm
Thống kê khu vực I, Vụ Thống kê Tổng hợp và
việc với Văn phòng FAO tại Hà Nội về việc hỗ
Trung tâm Tư liệu và Dịch vụ Thống kê nghiên
trợ kỹ thuật trong Tổng điều tra nông thôn,
cứu, vận dụng hệ thống thông tin địa lý vào
nông nghiệp và thủy sản năm 2016
tổng hợp và phổ biến thông tin thống kê của
một số chỉ tiêu thống kê trong Niên giám Chín là, Đề nghị Tổng cục tham khảo
thống kê hàng năm để đưa lên Trang thông tin kinh nghiệm của New Zealand xây dựng các
điện tử của Tổng cục. Trên cơ sở đó có kế phần mềm đào tạo thống kê trực tuyến để thí
hoạch đẩy mạnh áp dụng kỹ thuật này ở các điểm tại Tổng cục.

-------------------------------------------------
(Tiếp theo trang 12)

Tại kỳ họp lần thứ 44 của Ủy ban Thống Đối với Việt Nam nói chung, Tổng cục
kê Liên hợp quốc được tổ chức vào tháng Thống kê nói riêng, dữ liệu lớn là vấn đề mới.
2/2013 tại New York, phiên họp với tiêu đề “Big Tổng cục Thống kê cần giao một đơn vị của
Data for Policy, Development and Official Tổng cục chủ trì tiếp cận các nghiên cứu của
Statistics” (tạm dịch là “Big Data đối với chính Nhóm công tác toàn cầu về dữ liệu lớn và triển
sách, phát triển và thống kê nhà nước”). Tiếp khai áp dụng một cách bài bản ở Việt Nam. Dữ
theo đó Ủy ban Thống kê Liên hợp quốc đã hình liệu lớn đối với thống kê chính thức được triển
thành Nhóm công tác toàn cầu về dữ liệu lớn. khai ở nước ta, không chỉ giải quyết được vấn
Nhóm này đã công bố một số kết quả ban đầu đề chất lượng và hiệu quả của hoạt động
về dữ liệu lớn với thống kê chính thức. Hoạt thống kê, mà còn thể hiện mức độ hội nhập
động tiếp theo của Nhóm này sẽ đưa ra các với thống kê quốc tế.
hướng dẫn về dữ liệu lớn đối với thống kê chính
Tài liệu tham khảo:
thức. Một số cơ quan thống kê quốc gia của
một số nước và tổ chức quốc tế cũng đang tập [1] Wikipedia;
trung nghiên cứu, sử dụng dữ liệu lớn. https://en.wikipedia.org/wiki/Big_data

6 SỐ 04– 2015

You might also like