« Home « Kết quả tìm kiếm

KỸ THUẬT LÀM NỘI DUNG SỐ THEO TIÊU CHUẨN WEBOMETRICS


Tóm tắt Xem thử

- XẾP HẠNG WEBSITE ĐẠI HỌC QUA CHỈ SỐ WEBOMETRICS.
- Chính vì vậy, để đánh giá website của các đại học, ngoài quy mô (đo bằng số trang khác nhau trên cùng một tên miền), tính hấp dẫn (đo bằng số các tham chiếu từ website khác) thì cần tính đến số các file tài liệu trong các định dạng thường dùng và các tài liệu khoa học có thể nhận diện qua chuẩn mực trình bày..
- Chỉ số webometrics là một chỉ số tổng hợp được tính từ 4 loại chỉ số sau:.
- Chỉ số quy mô website gọi là S do viết tắt từ Size, tính theo số trang độc lập của website xuất hiện dưới tên miền tương ứng..
- Chỉ số nhận diện V do viết tắt từ Visibility, tính bằng tổng tất cả các đường link ở các website khác đến một trang nào đó trong website.
- Theo ý nghĩa này, nó cũng gọi là chỉ số tham chiếu inlink.
- Chỉ số này được xem là chỉ số có ý nghĩa nhất về ảnh hưởng của một website trên Internet vì nó thể hiện sự hấp dẫn của website..
- Chỉ số độ phong phú nội dung R do viết tắt từ Rich file đo bằng tổng số các file trong các định dạng tài liệu phổ biến như Microsoft Word (doc), Adobe Acrobat (pdf), Microsoft Powerpoint (ppt), Adobe PostScript (ps).
- Chỉ số thư tịch khoa học Sc viết tắt từ Scholar, đo số tài liệu khoa học viết dưới định dạng html hay pdf có cấu trúc chuẩn của một tài liệu khoa học..
- Vi ệc đo các chỉ số trên thực hiện qua các công cụ tìm kiểm (search engine) của một số nhà cung cấp dịch vụ tìm kiếm lớn trên Internet như Google, Yahoo, Microsoft, Altavista...Các nhà cung cấp này sử dụng các phần mềm chuyên dụng (gọi là spider hay robot) lần vết theo các liên kết web trên mạng Internet để lấy các trang web đưa về máy chủ của họ, sau đó dùng các thuật toán tính đặc trưng để lập chỉ dẫn (index) các thông tin lấy được từ các trang web rồi đưa vào cơ sở dữ liệu chỉ dẫn của mình để phục vụ tìm kiếm..
- Đối với chỉ số S : lấy số lượng trang nội dung trên 4 công cụ tìm kiếm Google, Yahoo, Live Search và Exalead với các lệnh có cú pháp dưới đây:.
- Yahoo site: tên_miền OR site:www.tên_miền Google site: tên_miền OR site:www.tên_miền.
- Alta vista domain: tên_miền OR domain:www.tên_miền.
- (ví dụ ĐHQGHN có sử dụng cả hai tên miền vnu.edu.vn và www.vnu.edu.vn) nên các lệnh trên áp dụng đồng thời cho cả hai tên miền.
- Đối với chỉ số V, sử dụng các lệnh có cú pháp như sau:.
- Yahoo link: tên_miền OR link:www.tên_miền.
- Alta vista linkdomain: tên_miền OR linkdomain:www.tên_miền Chỉ số R sẽ được đo theo từng kiểu file rồi cộng lại.
- filetype:doc (site: tên_miền OR site:www.tên_miền) filetype:pdf (site: tên_miền OR site:www.tên_miền) filetype:ppt (site: tên_miền OR site:www.tên_miền).
- filetype:ps (site:tên _miền OR site:www.tên_miền).
- Đối với chỉ số Sc, ta dùng công cụ tìm kiếm của Google Scholar.
- Công cụ này căn cứ vào các tài liệu pdf và html, tuân thủ định dạng chuẩn của tài liệu khoa học.
- Cú pháp tính chỉ số Sc như sau:.
- Google Scholar site: tên_miền OR site:www.tên_miền.
- Trong các lệnh trên để tính các chỉ số cho ĐHQGHN chỉ cần thay tên_miền bởi vnu.edu.vn.
- Để xếp hạng một nhóm website (ví dụ có thể thực hiện theo từng khu vực như Đông Nam Á, châu Á hay toàn cầu) trước hết người ta xếp hạng theo từng chỉ số S, V, R và Sc.
- Website nào có chỉ số lớn hơn sẽ được xếp trước (có thứ tự nhỏ hơn).
- Website có chỉ số lớn nhất sẽ được xếp thứ 1.
- Nếu thứ tự xếp hạng theo các chỉ số S, V, R và Sc lần lượt là R(S), R(V), R(R) và R(Sc) thì chỉ số webometrics sẽ được tính bằng công thức.
- Đặc biệt lưu ý rằng, các công cụ tìm kiếm không chỉ tính số lượng trang, số lượng inlink và số lượng file của chính website được chỉ ra mà còn tính cả số lượng các website là tên miền con.
- Theo đó, các số liệu đo của các website như hus.vnu.edu.vn, ussh.vnu.edu.vn, ueb.vnu.edu.vn v.v.
- không những được tính cho chính nó mà còn được tính cho cả website vnu.edu.vn.
- Tuy nhiên nếu các website hus.edu.vn, ussh.edu.vn, ueb.edu.vn.
- k hông đồng thời là các trang tương ứng hus.vnu.edu.vn, ussh.vnu.edu.vn, ueb.vnu.edu.vn thì chúng sẽ không đóng góp được vào tổng chung của website vnu.edu.vn.
- Vì thế cách sử dụng tên miền của các tổ chức thành viên hay trực thuộc có ảnh hưởng quan trọng đến chỉ số xếp hạng của website..
- Điều này giải thích cho việc chỉ số đo từ website mẹ thường nhỏ hơn tổng các chỉ số tương ứng của tất cả các site con.
- Về cấu trúc và điều kiện của một file được nhận diện như một tài liệu khoa học..
- Do các công cụ tìm kiếm không đủ thông mình để nhận diện nội dung của một tài liệu được xem là tài liệu khoa học, nên Google Scholar đã chọn các nhận diện thông qua phân tích cấu trúc..
- Phần liệt kê tài liệu tham khảo (Biography hay Reference) đặt ở phần cuối cùng của bài.
- Sau dòng có chỉ dẫn Biography hay Reference là các tài liệu tham khảo.
- Sau đây là một vài ví dụ về các thẻ siêu dữ liệu được lồng ghép trong các tài liệu giúp cho việc xử lý các tài liệu..
- Khi được cấu hình, các phần mềm quản trị tài liệu điện tử có khả năng tự động tạo các thẻ này.
- Một số vấn đề có liên quan có thể tìm thấy trong các tài liệu hướng dẫn về D- Space mà ĐHQGHN đã giao cho Trung tâm Thông tin Thư viện hỗ trợ các đơn vị triển khai..
- L iên quan đến chỉ số xếp hạng, hệ thống website của ĐHQGHN còn một số bất cập sau đây:.
- Hệ thống tên miền chưa thống nhất.
- Một số đơn vị hosting website của mình bên ngoài và dùng tên miền không nằm trong hệ thống của ĐHQGHN.
- Một số đơn vị còn sử dụng đồng thời nhiều tên miền khác nhau, khiến các máy tìm kiếm không nhận diện được các website của cùng một tổ chức.
- Trước tháng 3/2011 chỉ có 1/3 số đơn vị trực thuộc dùng tên miền trong hệ thống của ĐHQGHN, 1/3 có website dùng tên miền và địa chỉ ở ngoài ĐHQGHN và 1/3 chưa có website..
- ĐHQG HN đã chỉ đạo quyết liệt việc thống nhất tên miền.
- Trung tâm UDCNTT đã cấp toàn bộ tên miền trong hệ thống của ĐHQG cho các đơn vị kể cả các đơn vị cấp dưới.
- Chỉ số rich file, chỉ số inlink và chỉ số thư tịch khoa học đều rất thấp, không tương xứng với thực lực của ĐHQG HN.
- Các đơn vị khác đóng góp hầu như không đóng góp đáng kể vào chỉ số chung của ĐHQGHN..
- BGĐ ĐHQGHN đã thi hành nhiều biện pháp để nâng cao các chỉ số này..
- Trong một tháng gần đây, các chỉ số phục vụ xếp hạng đã được cải thiện rõ rệt đối với các site thành phần là site của Trung tâm Thông tin Thư viện và chính site của ĐHQGHN.
- Bảng 2A là các chỉ số phục vụ xếp hạng đo vào đầu tháng 3/2011.
- Chỉ số Sc, V, S của một số website trong ĐHQGHN đo vào đầu tháng 3/2011.
- www.vnu.edu.vn NA .
- www.ussh.edu.vn NA Trường ĐHKHTN.
- www.hus.edu.vn NA Trường ĐH Ngoại ngữ.
- www.ulis.vnu.edu.vn NA Trường ĐH Công nghệ.
- www.coltech.vnu.edu.vn NA Trường ĐH Kinh tế.
- www.ueb.vnu.edu.vn NA Trường ĐH Giáo dục.
- www.education.vnu.edu.vn NA Khoa Quốc tế.
- www.is.vnu.edu.vn NA .
- www.lic.vnu.edu.vn NA .
- www.js.vnu.edu.vn NA .
- Các chỉ số Sc, V, S, R của ĐHQG HN và một số đơn vị đào tạo và nghiên cứu tính đến ngày 7/4/2011..
- Đại học Quốc gia Hà Nội www.vnu.edu.vn.
- ussh.edu.vn.
- www.ussh.vnu.edu.vn.
- Trường ĐHKHTN hus.vnu.edu.vn www.hus.vnu.edu.vn.
- Trường ĐH Ngoại ngữ www.ulis.vnu.edu.vn.
- Trường ĐH Công nghệ www.coltech.vnu.edu.vn.
- www.ueb.vnu.edu.vn www.ueb.edu.vn.
- Trường ĐH Giáo dục www.education.vnu.edu.vn.
- Khoa Quốc tế www.is.vnu.edu.vn.
- Khoaluatdhqg.edu.vn.
- Khoa Sau Đại học Sgs.vnu.edu.vn.
- Hsb.edu.vn Bs.vnu.edu.vn.
- Trung tâm TT Thư viện www.lic.edu.vn.
- www.lic.vnu.edu.vn.
- Tạp chí khoa học VNU www.js.vnu.edu.vn.
- CNSH www.Biotechvnu.edu.vn.
- Viện Việt Nam học và Khoa học Phát triển www.ivides.edu.vn.
- Viện Công Nghệ thông tin iti.vnu.edu.vn.
- CÁC KỸ THUẬT TỔ CHỨC DỮ LIỆU PHỤC VỤ CHO NÂNG CÁC CHỈ SỐ WEBOMETRICS..
- Việc nâng hạng thực chất là nâng các chỉ số cơ sở S, R, V, Sc.
- Để nâng các chỉ số này chỉ còn 3 vấn đề:.
- Tăng số lượng các rich file, chú trọng việc viết đúng chuẩn tài liệu khoa học giúp nhận diện được các tài liệu khoa học;.
- Làm thế nào để các robot tìm thấy các tài liệu..
- Tổ chức tên miền đúng quy cách, tất cả phải nằm trong hệ thống tên miền của ĐHQGHN, kể cả trang của các đơn vị cấp dưới.
- Để không làm mất mối liên hệ của các tên miền của các đơn vị chưa dùng tên miền của ĐHQGHN, ĐHQGHN cho phép các đơn vị được dùng tới hết năm 2011.
- Sau thời gian này, phải hủy bỏ các tên miền cũ không nằm trong hệ thống tên miền của ĐHQGHN.
- Việc dùng song song hai tên miền phải là song song thực sự, hai tên miền đều được khai báo cho cùng một website vật lý, chứ không phải sử dụng tên miền của ĐHQG để chuyển hướng đến tên miền cũ vì cách làm này sẽ không làm cho các site của các đơn vị có đóng góp thực sự vào các chỉ số cơ sở để tính webometrics..
- Ngoài ra phải chuyển tên miền của cả các đơn vị cấp dưới theo hệ thống tên miền của ĐHQGHN..
- Tổ chức link thích hợp để các robot có thể tìm được hết tài liệu.
- Khuyến cáo số địa chỉ trung gian để đi đến tài liệu không vượt quá 10%.
- số địa chỉ tài liệu..
- Đối với các site phức tạp, thời gian để thấy sự thay đổi với các chỉ số Sc có thể từ vài tuần đến vài tháng..
- Ý nghĩa của việc nhận diện không phải ở chỗ làm tăng các chỉ số một cách hình thức mà chính là ở chỗ: khi đã nhận diện được, các công cụ tìm.
- kiếm mới lập được chỉ dẫn và từ đó có thể tìm kiếm được tài liệu trên Internet qua các công cụ tìm kiếm