- Trang phụ bìa NGUYỄN VIỆT ANH XÂY DỰNG THUẬT TOÁN LỰA CHỌN MÁY CHỦ CHO HỆ THỐNG MẠNG PHÂN TÁN DỮ LIỆU Chuyên ngành : CÔNG NGHỆ THÔNG TIN LUẬN VĂN THẠC SĨ KỸ THUẬT CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. - 8 CHƯƠNG 1: HỆ THỐNG MẠNG PHÂN TÁN DỮ LIỆU. - Máy chủ. - Nội dung/loại dịch vụ. - Phân phối ni dung. - Môi trường ứng dụng của mạng phân phối nội dung. - Các thành phần của mạng phân phối nội dung. - 27 3 CHƯƠNG 2: THUẬT TOÁN LỰA CHỌN MÁY CHỦ CHO HỆ THỐNG MẠNG PHÂN TÁN DỮ LIỆU. - Các thuật toán lựa chọn máy chủ trong hệ thống mạng phân tán dữ liệu. - Thuật toán cho MAB. - Mô hình mạng CDN. - Nội dung/dịch vụ được cung cấp bởi CDN. - Cấu trúc hệ thống định tuyến yêu cầu. - Quá trình phân phối nội dụng. - Phân phối nội dung trong một mạng CDN và giữa các mạng CDN ngang cấp. - Sơ đồ hàm chọn máy chủ của thuật toán Epsilon-Greedy. - Sơ đồ hàm chọn máy chủ của thuật toán Softmax. - Sơ đồ hàm chọn máy chủ của thuật toán UCB. - Hệ thống mạng phân tán dữ liệu là mt giải pháp hữu hiệu để cải tiến cht lượng dịch vụ Internet. - Hệ thống mạng phân tán dữ liệu tái tạo lại ni dung gốc đến các máy chủ bản sao nằm ở các nơi khác nhau và đáp ứng yêu cầu từ máy chủ bản sao gần nht với nơi phát ra yêu cầu đó. - Lựa chọn máy chủ để đáp ứng các yêu cầu là mt trong những vn đề quan trọng cần giải quyết trong hệ thống mạng phân tán để đáp ứng người dùng tốt nht, cải thiện cht lượng dịch vụ. - Đề tài được chọn với mong muốn tìm hiểu về thuật toán lựa chọn máy chủ trong hệ thống mạng phân tán dữ liệu nhằm tăng hiệu năng và cải thiện cht lượng dịch vụ. - Mục đích của đề tài (các kết quả cần đạt được) Luận văn nghiên cứu về các thuật toán lựa chọn máy chủ cho mạng phân tán dữ liệu. - Trên cơ sở đó xây dựng thuật toán để lựa chọn máy chủ cho mạng phân tán dữ liệu và khảo sát đánh giá thuật toán đó. - Đối tượng, phạm vi nghiên cứu - Đối tượng: Thuật toán lựa chọn máy chủ trong hệ thống mạng phân tán dữ liệu mà cụ thể là các thuật toán MAB 8 - Phạm vi nghiên cứu: Giả lập mt môi trường mạng phân tán ni dung đồng thời áp dụng các thuật toán nghiên cứu được trên môi trường giả lập. - Phương pháp nghiên cứu - Phương pháp nghiên cứu lý thuyết: o Tìm hiểu về mạng phân tán qua các sách khảo và các bài báo mạng o Tìm hiểu giải thuật chọn lựa máy chủ qua sách tham khảo và các bài báo mạng. - Chương 1: Hệ thống mạng phân tán dữ liệu - Chương 2: Thuật toán lựa chọn máy chủ cho hệ thống mạng phân tán dữ liệu - Chương 3: Xây dựng giải thuật Multi-Armed Bandit. - 9 CHƯƠNG 1: HỆ THỐNG MẠNG PHÂN TÁN DỮ LIỆU Với sự phát triển của Internet, các dịch vụ Web phổ biến thường bị tắc nghẽn do nhu cầu thực hiện trên dịch vụ lớn. - Nó có thể gây ra tình trạng không thể quản lý luồng lưu lượng, dẫn đến nhiều yêu cầu bị mt. - Sao chép ni dung giống nhau hoặc chiến lược nhân đôi dịch vụ trên mt số máy chủ Web được đặt tại các địa điểm khác nhau là mt phương pháp thường được sử dụng bởi các nhà cung cp dịch vụ để cải thiện hiệu sut và khả năng mở rng. - Người sử dụng được chuyển hướng đến các máy chủ gần nht và phương pháp này gip giảm thiểu tác đng trên mạng vào thời gian đáp ứng các yêu cầu của người dùng. - Content Delivery Networks (CDN) cung cp dịch vụ để cải thiện hiệu sut mạng bằng cách tối ưu hóa băng thông, nâng cao khả năng tiếp cận và duy trì tính đng đắn thông qua bản sao ni dung. - CDN có mt số sự kết hợp của giải phóng ni dung, yêu cầu định tuyến, phân phối và cơ sở hạ tầng. - Các cơ sở hạ tầng phân phối ni dung bao gồm mt tập hợp các máy chủ lân cận (còn gọi là máy chủ đại diện) cung cp bản sao ni dung tới người dùng cuối cùng. - Các cơ sở hạ tầng theo yêu cầu định tuyến có trách nhiệm chỉ đạo yêu cầu khách hàng đến các máy chủ lân cận thích hợp. - Nó cũng tương tác với các cơ sở hạ tầng phân phối để cập nhật các ni dung được lưu trữ trong b nhớ đệm CDN. - Các cơ sở hạ tầng phân phối di chuyển ni dung từ máy chủ gốc đến các máy chủ lân cận và đảm bảo tính thống nht của ni dung trong b nhớ đệm. - Các cơ sở hạ tầng kế toán duy trì các bản ghi của khách hàng truy cập và ghi lại việc sử dụng các máy chủ CDN. - Khách hàng tiêu biểu của CDN là phương tiện truyền thông và các công ty quảng cáo Internet, trung tâm dữ liệu, cung cp dịch vụ Internet, các nhà bán lẻ âm nhạc trực tuyến, các nhà khai thác di đng, nhà sản xut thiết bị điện tử tiêu dùng, và các công ty cung cp dịch vụ khác. - Mỗi mt khách hàng 10 muốn xut bản và chuyển tải ni dung đến người dùng cuối trên Internet mt cách đáng tin cậy và kịp thời. - Định nghĩa CDN Mạng CDN là mt tập hợp các phần tử mạng được sắp xếp để phân phối ni dung hiệu quả hơn cho người dùng. - Mạng CDN có thể có nhiều hình thức và cu trc khác nhau Các chức năng tiêu biểu của mt CDN bao gồm. - Yêu cầu chuyển hướng và phân phối ni dung để chỉ đạo mt yêu cầu đến máy chủ thay thế thích hợp nht bằng cách sử dụng các cơ chế để vượt qua tình trạng tắc nghẽn. - Dịch vụ phân phối ni dung để nhân rng và thay thế ni dung b nhớ đệm các máy chủ phân phối đại diện cho máy chủ gốc. - Các dịch vụ đàm phán ni dung để đáp ứng nhu cầu cụ thể của từng người dùng cá nhân (hoặc nhóm người dùng. - Quản lý dịch vụ để quản lý các thành phần mạng, giải quyết hoạch toán, giám sát và báo cáo về việc sử dụng ni dung. - CDN cung cp hiệu sut tốt hơn thông qua b nhớ đệm hoặc sao chép ni dung trên mt số máy chủ thay thế được đặt tại các địa điểm khác nhau để đối phó với sự tăng vọt bt ngờ trong các yêu cầu ni dung web. - Trong mạng CDN, ni dung đề cập đến bt kỳ nguồn dữ liệu kỹ thuật số và nó bao gồm hai phần chính: các dữ liệu đa phương tiện được mã hóa và siêu dữ liệu. - Các dữ liệu đa phương tiện bao gồm mã hóa tĩnh, đng và dữ liệu đa phương tiện liên tục (ví dụ như âm thanh, video, tài liệu, hình ảnh và các trang web). - Siêu dữ liệu là mô tả ni dung cho phép nhận dạng, phát hiện và quản lý các dữ liệu đa phương tiện, và cũng tạo điều kiện cho việc giải thích các dữ liệu đa phương tiện. - Tuy nhiên, Internet ngày nay và các kiến trc Intranet kết hợp không có khả năng xử lý lượng truyền thống đa phương tiện và các dịch vụ ni dung đòi hỏi lưu lượng lớn mà các khách hàng trực tuyến tìm kiếm ở tốc đ mà họ mong muốn. - Kể cả việc bổ sung các đường mạng nhanh hơn, các máy chủ mạnh hơn vẫn không giải quyết được vn đề. - Kết quả là rt nhiều nhà cung cp dịch vụ ni dung, các nhà kinh doanh điện tử thương mại, các tổ chức và các doanh nghiệp phải chịu đựng các máy chủ quá tải và truy nhập mạng với tốc đ chậm làm nản lòng khách hàng, nhân viên. - Giải pháp mạng phân phối ni dung nhằm nâng cao năng lực của mạng. - Nếu lưu lượng giữa người dùng và máy chủ không đi qua phần mạng bị nghẽn thì có nhiều khả năng là tốc đ truyền dữ liệu sẽ cao hơn. - Mô hình mạng CDN 12 Trong mạng CDN có nhiều các máy chủ thay thế được đặt ở các vị trí khác nhau. - Các máy chủ thay thế thường có ni dung như nhau, tuy nhiên khách hàng chỉ có thể kết nối mt số máy chủ thay thế phù hợp theo chính sách của nhà cung cp CDN. - Trong kỷ nguyên thông tin, mt giải pháp mạng CDN cho phép các doanh nghiệp, các nhà cung cp dịch vụ ni dung điều khiển ni dung của họ và quản lý nó. - Các mạng CDN cho phép các doanh nghiệp. - Cải thiện cht lượng mạng và cht lượng dịch vụ thậm chí ngay cả khi lưu lượng tổng tăng lên. - Sử dụng dữ liệu đa phương tiện dung lượng cao như video để tăng cường năng lực phục vụ người dùng cuối mà không bị tắc nghẽn ở các mạng. - Đảm bảo cung cp ni dung dữ liệu mới nht cho người dùng cuối trong các môi trường phát triển nhanh. - Giảm phí tổn băng thông tổng mà không làm ảnh hưởng đến cht lượng dịch vụ tới người dùng cuối. - Phân phối các ứng dụng phân tán trên mạng sẵn có mà không phải chịu chi phí tiền vốn lớn. - Bắt kịp các dạng dữ liệu Internet hiện tại và tương lai. - 13 Giải pháp mạng phân phối ni dung nhằm nâng cao năng lực của mạng. - Nếu lưu lượng giữa máy khách và máy chủ không đi quan phần mạng bị nghẽn thì có nhiều khả năng là tốc đ truyền sẽ cao hơn. - Tuy nhiên, nếu tuyến kết nối phải đi qua phần mạng bị nghẽn thì máy khách có thể kết nối với mt máy chủ thay thế với đường truyền không bị nghẽn. - Nhà cung cp mạng CDN đảm bảo phân phối ni dung kỹ thuật số bt kỳ mt cách nhanh chóng. - Các nguồn của ni dung bao gồm các doanh nghiệp lớn, các nhà cung cp dịch vụ web, các công ty truyền thông và các đài truyền tin tức. - Người dùng cuối có thể tương tác với mạng CDN bằng cách xác định các yêu cầu ni dung/dịch vụ thông qua điện thoại di đng, điện thoại thông minh/PDA, máy tính xách tay và máy tính để bàn. - Hình 2 mô tả các ni dung/dịch vụ khác nhau được phục vụ bởi mt nhà cung cp CDN cho người dùng. - Nội dung/dịch vụ được cung cấp bởi CDN Nhà cung cp CDN tính phí khách hàng của họ theo các ni dung được cung cp (tức là lưu lượng) đến người dùng cuối cùng của các máy chủ thay thế. - Mạng 14 CDN hỗ trợ mt cơ chế kế toán để thu thập và theo dõi thông tin sử dụng của khách hàng liên quan đến yêu cầu định tuyến, phân phối và chuyển giao. - Chi phí trung bình của tính phí dịch vụ CDN là khá cao, thường ra khỏi tầm với của nhiều doanh nghiệp vừa và nhỏ hay không cho lợi nhuận tổ chức. - Các yếu tố ảnh hưởng nht ảnh hưởng đến giá của các dịch vụ CDN bao gồm. - Chi phí băng thông - Các tác đng của phân phối lưu lượng truy cập - Kích thước của ni dung nhân rng trên các máy chủ thay thế - Số lượng máy chủ thay thế - Các vn đề đ tin cậy và ổn định của toàn hệ thống và an ninh của phân phối ni dung. - Mạng CDN nhằm vào các nhà cung cp ni dung hoặc những khách hàng muốn đảm bảo cht lượng dịch vụ QoS cho các người dùng cuối trong khi truy cập ni dung web của họ. - Khả năng mở rng đề cập đến khả năng của hệ thống để mở rng và xử lý mt lượng dữ liệu mới và lớn, người sử dụng và các giao dịch mà không có bt kỳ sự suy giảm đáng kể nào trong hoạt đng. - Mạng CDN hoạt đng như b giảm sốc cho lưu lượng truy nhập bằng cách tự đng cung cp dung lượng 15 theo yêu cầu để đáp ứng các yêu cầu, tránh tắc nghẽn. - Khả năng này cho phép CDN tránh được tốn kém tài nguyên vượt quá dự phòng và cung cp hiệu sut cao cho mọi người dùng. - Nếu không kiểm soát an ninh thích hợp, nền tảng CDN sẽ bị đối tượng lừa đảo trên mạng, tn công từ chối dịch vụ (DDoS), virus, và sự xâm nhập không mong muốn khác có thể phá hỏng doanh nghiêp. - CDN nhằm đáp ứng các yêu cầu nghiêm ngặt về vật lý, mạng, phần mềm, dữ liệu và thủ tục an ninh. - Khả năng đáp ứng, trước khi việc ngừng trệ có thể sau bao lâu mt dịch vụ sẽ bắt đầu thực hiện hoạt đng bình thường. - Hiệu sut của mt CDN thường được đặc trưng bởi thời gian đáp ứng (tức là đ trễ) cảm nhận của người dùng cuối. - Đ tin cậy và hiệu sut của mt CDN bị ảnh hưởng bởi vị trí phân phối ni dung và cơ chế định tuyến, cũng như sao chép dữ liệu và chiến lược b nhớ đệm. - CDN lưu trữ mt trang web cũng tập trung vào việc cung cp dịch vụ nhanh chóng và đáng tin cậy vì nó nhn mạnh thông điệp rằng công ty là đáng tin cậy và ly khách hàng làm trọng. - Các thành phần CDN Ba thành phần chính của mt mạng CDN là: nhà cung cp ni dung, nhà cung cp CDN và người dùng cuối. - Mt nhà cung cp ni dung hoặc khách hàng là mt trong những đại diện không gian tên URI của các đối tượng web được phân phối. - Các máy chủ gốc của các nhà cung cp ni dung giữa các đối tượng. - Mt nhà cung cp CDN là mt tổ chức hoặc công ty cung cp các cơ sở hạ tầng để cung cp ni dung đc quyền mt cách kịp thời và đáng tin cậy. - Người dùng cuối cùng hoặc khách hàng là các chủ thể truy cập ni dung từ trang web của các nhà cung cp ni dung. - Các nhà cung cp CDN sử dụng b nhớ đệm và/hoặc bản sao các máy chủ đặt tại các vị trí địa lý khác nhau để sao chép ni dung. - Máy chủ đệm CDN cũng được gọi là máy chủ hoặc máy chủ đại diện gần nht. - Những máy chủ đại diện của mt CDN nói chung được gọi là cụm web. - CDN phân phối ni dung cho những máy chủ đại diện theo cách như vậy mà tt cả các máy chủ đệm chia sẻ cùng mt ni dung và URL. - Các yêu cầu của khách hàng được chuyển đến cho máy chủ thay thế gần đó, và mt máy chủ thay thế được lựa chọn phân phối những yêu cầu ni dung cho người dùng cuối. - Như vậy, người dùng có thể có được sự minh bạch. - Ngoài ra, những máy chủ đại diện gửi thông tin kế toán và các ni dung giao tiếp cho các hệ thống kế toán của các nhà cung cp CDN. - Kiến trúc lp Kiến trc của mạng lưới phân phối ni dung có thể được trình bày theo cách tiếp cận lớp
Xem thử không khả dụng, vui lòng xem tại trang nguồn hoặc xem
Tóm tắt