« Home « Kết quả tìm kiếm

Các khái niệm cơ bản về nơron


Tóm tắt Xem thử

- ỨNG DỤNG MẠNG NƠRON TRUYỀN THẲNG TRONG DỰ BÁO DỮ LIỆU.
- Sơ lược về lĩnh vực dự báo dữ liệu.
- Thu thập, phân tích và xử lý dữ liệu.
- Thu thập dữ liệu ...44.
- Phân tích dữ liệu ...45.
- Xử lý dữ liệu ...46.
- Chương trình dự báo dữ liệu.
- Chương trình dự báo dữ liệu ...69.
- 2) Các đơn vị đầu ra (Output units), gửi dữ liệu ra bên ngoài;.
- Một đầu vào tới một đơn vị có thể là dữ liệu từ bên ngoài mạng, hoặc đầu ra của một đơn vị khác, hoặc là đầu ra của chính nó..
- Dòng dữ liệu từ đơn vị đầu vào đến đơn vị đầu ra chỉ được truyền thẳng.
- Việc xử lý dữ liệu có thể mở rộng ra nhiều lớp, nhưng không có các liên kết phản hồi.
- Sử dụng quá ít đơn vị có thể dẫn đến việc không thể nhận dạng được các tín hiệu đầy đủ trong một tập dữ liệu phức tạp, hay thiếu ăn khớp (underfitting).
- Số lượng lớn các đơn vị có thể dẫn đến tình trạng thừa ăn khớp (overfitting), trong trường hợp này mạng có quá nhiều thông tin, hoặc lượng thông tin trong tập dữ liệu mẫu (training set) không đủ các dữ liệu đặc trưng để huấn luyện mạng..
- “Để một mạng có khả năng tổng quát hóa tốt, nó cần có số tham số ít hơn số dữ liệu có trong tập huấn luyện” ([4.
- Sơ lược về lĩnh vực dự báo dữ liệu 3.2.
- Thu thập, phân tích và xử lý dữ liệu 3.3.
- Ö Khoảng, khuôn dạng dữ liệu sẽ đưa vào mạng.
- Do vậy, việc cân nhắc để có thể chọn được mô hình phù hợp cho việc dự báo dữ liệu là một việc rất khó khăn (chỉ có thể bằng phương pháp thử-sai).
- Do đặc trưng về độ phức tạp dữ liệu, các dữ liệu đầu ra thường là các con số (mảng các số) dấu phảy động cho nên việc lựa chọn cấu trúc mạng phù hợp thường là sử dụng phương pháp thử-sai (trial and errors).
- các dữ liệu đầu vào và đầu ra để mạng có khả năng học tốt hơn từ các dữ liệu được cung cấp..
- Dữ liệu đóng một vai trò rất quan trọng trong các giải pháp sử dụng mạng nơron.
- Dữ liệu sau khi qua bước tiền xử lý được đưa vào mạng nơron.
- Hình 15: Xử lý dữ liệu 3.2.1.
- Các dữ liệu số cũng có thể thuộc loại này, ví dụ như: “mã vùng”, “mã nước”..
- Thu thập, phân tích dữ liệu.
- Thu thập dữ liệu.
- Bước thực hiện thu thập các dữ liệu bao gồm ba nhiệm vụ chính:.
- Xác định yêu cầu dữ liệu.
- Điều đầu tiên cần thực hiện khi lập kế hoạch thu thập dữ liệu ta là xác định xem các dữ liệu nào là cần thiết để có thể giải quyết bài toán.
- Ta cần phải biết: a) Các dữ liệu chắc chắn có liên quan đến bài toán.
- b) Các dữ liệu nào có thể liên quan.
- c) Các dữ liệu nào là phụ trợ.
- Các dữ liệu có liên quan và có thể liên quan đến bài toán cần phải được xem là các đầu vào cho hệ thống..
- Xác định nguồn dữ liệu.
- Trong một số trường hợp, ta có thể chọn lựa dữ liệu mô phỏng từ các tình huống thực tế..
- Tuy nhiên, cần phải quan tâm đến độ chính xác và khả năng thể hiện của dữ liệu đối với các trường hợp cụ thể..
- Xác định lượng dữ liệu.
- Ta cần phải ước đoán số lượng dữ liệu cần thiết để có thể sử dụng trong việc xây dựng mạng.
- cho mạng quá nhiều dữ liệu.
- Phân tích dữ liệu.
- Có hai kỹ thuật cơ bản giúp ta có thể hiểu được dữ liệu:.
- Trực quan hóa dữ liệu.
- Xử lý dữ liệu.
- Dẫn nhập về xử lý dữ liệu.
- Kiểm tra tính hợp lệ dữ liệu (Data validity checks).
- Phân hoạch dữ liệu (Partitioning data).
- Về mặt lý thuyết, một mạng nơron có thể dùng để ánh xạ các dữ liệu thô đầu vào trực tiếp thành các dữ liệu đầu ra.
- Nhưng trong thực tế, việc sử dụng quá trình tiền xử lý cho dữ liệu.
- Có rất nhiều kỹ thuật liên quan đến tiền xử lý dữ liệu.
- Tiền xử lý dữ liệu có thể là thực hiện lọc dữ liệu (trong dữ liệu biến thiên theo thời gian time-series) hay các phương pháp phức tạp hơn như là các phương pháp kết xuất, trích chọn các đặc trưng từ dữ liệu ảnh tĩnh (image data).
- Tuy nhiên, mục đích của các thuật toán tiền xử lý dữ liệu thường tương tự nhau, như sau (Xem chẳng hạn [6]):.
- 1) Chuyển đổi dữ liệu về khuôn dạng phù hợp đối với đầu vào mạng nơron - điều này thường đơn giản hóa quá trình xử lý của mạng phải thực hiện trong thời gian ngắn hơn..
- Mã hóa các dữ liệu văn bản trong cơ sở dữ liệu;.
- Chuyển đổi dữ liệu sao cho nó có giá trị nằm trong khoảng [0, 1]..
- Lấy biến đổi Fourier cho các dữ liệu thời gian..
- 3) Tối thiểu hóa số các đầu vào mạng - giảm số chiều của dữ liệu đầu vào và tối thiểu số các mẫu đưa vào có thể đơn giản hóa được bài toán.
- Như đã nêu ở trên, có rất nhiều các phương pháp có thể áp dụng cho dữ liệu ở quá trình tiền xử lý cũng như hậu xử lý.
- Tiền xử lý dữ liệu.
- ii) Thu thập dữ liệu..
- iii) Tiền xử lý dữ liệu..
- Trong bài toán dự báo các dữ liệu thương mại thì các học thuyết kinh tế có thể giúp chọn lựa các biến là các chỉ số kinh tế quan trọng.
- Tại bước này trong quá trình thiết kế, điều cần quan tâm đó là các dữ liệu thô từ đó có thể phát triển thành các chỉ số quan trọng.
- Bước 2: Thu thập dữ liệu.
- Cần xem xét khả năng có thể thu thập được các dữ liệu.
- Các dữ liệu kỹ thuật có thể thu thập được dễ dàng hơn là các dữ liệu cơ bản.
- Bước 3: Tiền xử lý dữ liệu.
- Bước 4: Phân chia tập dữ liệu.
- Tập kiểm tra thường chứa khoảng 10% đến 30% tập dữ liệu huấn luyện, được sử dụng để kiểm tra mức độ tổng quát hóa của mạng sau khi huấn luyện..
- Huấn luyện mạng học các dữ liệu bằng cách lần lượt đưa các mẫu vào cùng với những giá trị mong muốn.
- hàm lỗi nữa đối với dữ liệu dựa trên một số tập các tham số của mạng được chọn ngẫu nhiên.
- Mạng sử dụng trong bài toán dự báo dữ liệu là mạng truyền thẳng nhiều lớp, được huấn luyện bởi thuật toán lan truyền ngược sửa đổi (có sử dụng tham số bước đà) để tăng khả năng tổng quát hóa và thời gian hội tụ.
- Ở đây nêu ra một ví dụ của bài toán dự báo dữ liệu: Bài toán dự báo khả năng sử dụng khí ga.
- Phần khó nhất trong việc xây dựng mô hình là xác định và thu thập được các dữ liệu huấn luyện và kiểm tra.
- Dữ liệu vào.
- Với các dữ liệu đã cho, có thể thiết lập mô hình phản ánh bởi sáu hiệu ứng sau:.
- Tập dữ liệu có thể được tạo ra bằng cách sử dụng bảng tính, các dữ liệu theo khuôn dạng nói trên sẽ được mã hóa thành dạng dưới đây:.
- Tất cả dữ liệu đầu vào được đưa về khoảng [0,1]..
- Mục tiêu của chúng ta là làm sao chỉ phải sử dụng số các đơn vị trong lớp ẩn càng ít càng tốt, đồng thời vẫn duy trì được khả năng của mạng có thể học được mối quan hệ giữa các dữ liệu.
- Một phần dữ liệu được sử dụng như là tập kiểm tra, tập này sẽ không được sử dụng trong quá trình huấn luyện.
- Trong quá trình huấn luyện trên tập dữ liệu huấn luyện, sự tổng quá hóa đối với các dữ liệu kiểm tra được hiển thị đồng thời dựa trên các tham số hiện tại của mạng..
- Chương trình dự báo dữ liệu Màn hình ban đầu của chương trình.
- Các tệp dữ liệu là các tệp có cấu trúc:.
- Các trường dữ liệu được phân cách bởi dấu.
- Trường dữ liệu dự báo là trường cuối cùng..
- Sau trường dữ liệu dự báo không cần phải có dấu.
- Tệp dữ liệu không được có các khoảng trống ở phía cuối.
- Tệp dữ liệu có dạng như sau:.
- Các dữ liệu sau khi được đọc vào sẽ được chuẩn hóa về khoảng [0,1] theo phương pháp:.
- Các đường màu xanh lá cây (nhạt) là các đầu ra mong muốn đối với tập dữ liệu.
- Các đường màu xanh đậm (sẫm) là trả lời của mạng đối với các dữ liệu đầu vào đưa vào nó..
- Có thể thấy, lỗi MSE được giảm sau một thời gian huấn luyện, đồng thời khả năng tổng quát hóa của mạng đối với các dữ liệu chưa được “biết” cũng đã tốt lên..
- Dự báo dữ liệu..
- Sau khi mạng đã được huấn luyện, có thể sử dụng để dự báo dữ liệu.
- Chỉ cần xác định tệp chứa dữ liệu và thực hiện dự báo.
- Nếu dữ liệu đầu vào quá nhiều.
- Để có thể xem xét, đánh giá được khả năng tổng quát hóa của mạng, cần thực hiện phân chia tập dữ liệu thành các tập: huấn luyện (training set) và tập kiểm tra (test set).
- Chúng có thể hoạt động như một bộ nhớ tự liên hợp bằng cách sử dụng các dữ liệu đặc thù cho các ứng dụng, bài toán trong các lĩnh vực cụ thể.
- Cần nhấn mạnh rằng, để có thể dự báo được dữ liệu, ta cần sử dụng các dữ liệu lịch sử để huấn luyện và có thể cả các dữ liệu dự báo của các đầu vào (Ví dụ như: dự báo nhiệt độ ngày hôm sau.
- Đối với mỗi một bài toán, cần thực hiện phân tích cặn kẽ, cụ thể các dữ liệu trong phạm vi và sử dụng các tri thức thu thập được để có thể xây dựng được một mô hình thích hợp

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt