« Home « Kết quả tìm kiếm

Bài giảng Nhập môn lập trình khoa học dữ liệu: Bài 1 - Trương Xuân Nam


Tóm tắt Xem thử

- NHẬP MÔN LẬP TRÌNH KHOA HỌC DỮ LIỆU.
- Khoa học dữ liệu khác các khoa học khác ở điểm nào?.
- Một số vấn đề khoa học dữ liệu xung quanh chúng ta 3.
- Nghề làm khoa học dữ liệu có ưu thế gì?.
- Data scientist (nhà khoa học dữ liệu) làm gì?.
- Data scientist workflow 2.
- Data scientist cần gì?.
- Tên môn: Nhập môn Lập trình Khoa học Dữ liệu (Introduction to Programming for Data Science).
- Một số thư viện xử lý dữ liệu của python.
- Trực quan hóa dữ liệu.
- Học từ dữ liệu như thế nào.
- Kiến thức yêu cầu.
- Cấu trúc dữ liệu: mảng, danh sách, cây.
- Hiểu cách làm việc của hệ thống file, đọc ghi dữ liệu dạng văn bản từ file – hầu hết dữ liệu của môn học và ngành học này đều ở dạng text.
- Có kiến thức về các định dạng dữ liệu thường dùng trong cuộc sống (văn bản, ảnh, âm thanh, phim,...).
- Để có kiến thức về khoa học dữ liệu.
- Để có kĩ năng viết chương trình phục vụ cho các bài toan thuộc ngành khoa học dữ liệu.
- Để có hiểu biết về công việc của người làm khoa học dữ liệu và các bài toán liên quan.
- Để có hiểu biết về cách ứng dụng khoa học dữ liệu vào các vấn đề trong thực tế.
- Khoa học dữ liệu là gì?.
- Hầu hết các ngành khoa học từ xưa đến nay đều giải quyết vấn đề dựa trên lập luận và tri thức.
- Ta gọi các ngành khoa học này là “knowledge-driven”.
- Với quan điểm như vậy, tất cả những quan sát mà không được chứng minh chặt chẽ thường được cho là “không khoa học”.
- Khoa học dữ liệu ≠ Khoa học thông thường ở quan điểm: tìm tri thức từ dữ liệu (dẫn dắt bởi dữ liệu.
- Chúng ta rút ra tri thức bằng việc tìm tòi từ dữ liệu chứ không nhất thiết phải chứng minh nó.
- Một số vấn đề khoa học dữ liệu xung quanh chúng ta.
- Vấn đề quanh ta.
- Hãy nêu một vài vấn đề liên quan đến địa phương (quê) của bạn, mà bạn cho rằng có thể giải quyết bằng khoa học dữ liệu..
- Theo bạn có những vấn đề nào của trường ta có thể là đối tượng nghiên cứu của khoa học dữ liệu?.
- (vui) Đánh số đề có phải là bài toán của ngành khoa học dữ liệu?.
- Data scientist làm gì?.
- Thu thập và xử lý dữ liệu để tìm ra những “insight”.
- post/comment/status trên mạng xã hội, Data Scientist có thể tìm ra được: cứ gần đến ngày valentine thì tần suất xuất hiện các thương hiệu ABC cao hơn hẳn.
- Data analyst và Data scientist.
- Sản phẩm data là gì?.
- Sản phẩm data được xây dựng dựa trên dữ liệu.
- Tính năng recommendation của Amazon được xây dựng dựa trên dữ liệu của nó: người dùng muốn mua món đồ gì? Những món đồ nào nên mua kèm?.
- Sản phẩm data có thể là một sản phẩm riêng biệt hoặc một phần trong sản phẩm lớn.
- Sản phẩm data bao gồm nhiều thành phần nhưng mô hình dữ liệu là cốt lõi của nó và được xây dựng bằng các thuật toán học máy.
- Mô hình dữ liệu là gì?.
- Toàn bộ quá trình này gọi là học máy (machine learning) và cái hộp đen chính là mô hình dữ liệu.
- Data scientist workflow.
- Data scientist workflow – Bước 1.
- Hoặc, do chính Data Scientist khi làm việc với dữ liệu, nghiên cứu đặc tính của sản phẩm/ công ty cũng như kiểu/ lượng data hiện có… thì nảy sinh thêm sáng kiến phát minh tính năng XYZ.
- Data scientist workflow – Bước 2.
- Sẽ cần loại dữ liệu gì? Ở đâu? Bao nhiêu là đủ? Lấy dữ liệu như thế nào?.
- Tính năng này sẽ được gắn vào đâu trong sản phẩm cuối cùng và sẽ giúp ích được gì cho người dùng.
- Data scientist workflow – Bước 3.
- Thu thập và làm sạch dữ liệu.
- Nên phải đi “gom dữ liệu”.
- Dữ liệu gom xong sẽ còn lộn xộn và nhiều rác thì phải.
- “làm sạch dữ liệu”..
- Đồng bộ hóa dữ liệu.
- Hình ảnh mang về có kích thước khác nhau, phải đưa hết về cùng kích thước, định dạng theo mô hình dữ liệu đã chọn.
- Nếu dữ liệu chưa đủ phải thu thập thêm.
- Data scientist workflow – Bước 4.
- Nếu vấn đề đã có sẵn giải pháp.
- Nếu vấn đề chưa có sẵn giải pháp.
- Data scientist workflow – Bước 5.
- Data scientist workflow – Bước 6.
- Kết quả gắn vào một sản phẩm lớn có tính ứng dụng.
- Data scientist: tố chất cần có?.
- Tố chất này cực kì quan trọng vì DS phải dành phần lớn thời gian để thu thập và làm sạch dữ liệu.
- Với Team Business: để hiểu rõ hơn về sản phẩm cũng như requirements, từ đó tìm ra các insights có giá trị.
- Nghề Data Scientist còn mới mẻ và sử dụng nhiều kiến thức liên ngành..
- Data scientist cần kỹ năng gì?.
- Nghề Data Scientist đòi hỏi khá nhiều kiến thức và kĩ năng tổng hợp.
- Database: giúp lưu trữ, truy xuất dữ liệu cũng như thực hiện tính toán.
- Visualization: giúp hiểu hơn về dữ liệu hoặc trình bày kết quả phân tích.
- Nghề data science sử dụng nhiều kiến thức liên ngành..
- Data Scientist: Các kỹ năng cần thiết?.
- Công việc của Data Scientist rất gần với Software.
- Khi nhìn vào dữ liệu, bạn cần đủ nhạy để suy đoán: đối với loại dữ liệu này thì nên làm gì với nó, nên estimate như thế nào?

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt