MỤC LỤC
Xây dựng và gửi sitemap
- Quyết định những trang nào trong trang web của bạn cần được Google thu thập thông tin và xác định phiên bản chuẩn của mỗi trang.
- Quyết định định dạng sitemap nào mà bạn muốn sử dụng. Bạn có thể tạo sitemap theo cách thủ công hoặc chọn từ một trong số các công cụ của bên thứ ba để tạo sitemap cho bạn.
- Kiểm tra Sitemap của bạn bằng công cụ kiểm tra Sitemap trong Google Webmaster Tools.
- Làm cho sơ đồ trang web của bạn trở nên khả dụng với Google bằng cách thêm nó vào file robots.txt của bạn và gửi nó lên Webmaster Tools.
Định dạng sitemap
Tất cả các định dạng sitemap đều có giới hạn 50MB (không nén) và 50.000 URL. Nếu bạn có một file lớn hơn hoặc nhiều URL hơn, bạn sẽ phải chia nhỏ danh sách của mình vào nhiều sitemap. Bạn có thể tùy ý tạo một file chỉ mục sitemap (file trỏ tới danh sách sơ đồ trang web) và gửi file chỉ mục đó tới Google. Bạn có thể gửi nhiều sitemap hoặc file chỉ mục sơ đồ trang web tới Google.
Các định dạng sitemap mà Google hỗ trợ bao gồm:
+ XML: Google hỗ trợ các giao thức sitemap tiêu chuẩn, ngoài ra Google cũng hỗ trợ các phần mở rộng XML cho video, hình ảnh và tin tức; họ sử dụng các phần mở rộng này để mô tả các file video, hình ảnh và các nội dung khó phân tích khác trên trang web của bạn, từ đó giúp Google cải tiến cách lập chỉ mục các tài nguyên này.
+ RSS, mRSS và Atom 1.0:
Nếu bạn có một blog với nguồn cấp dữ liệu RSS hoặc Atom, bạn có thể gửi URL của nguồn cấp dữ liệu như một sitemap. Hầu hết các phần mềm blog có thể tạo nguồn cấp dữ liệu cho bạn nhưng những nguồn cấp dữ liệu này chỉ cung cấp thông tin về các URL gần đây:
- Google chấp nhận nguồn cấp dữ liệu RSS (Real Simple Syndication) 2.0 và Atom 1.0.
- Bạn có thể sử dụng nguồn cấp dữ liệu mRSS (media RSS) để cung cấp chi tiết về nội dung video trong trang web của bạn.
+ Text
Nếu sitemap của bạn chỉ bao gồm các URL của các trang trong web của bạn thì bạn có thể cung cấp cho Google một file text đơn giản trong đó mỗi dòng là một URL. Ví dụ:
http://www.example.com/file1.html
http://www.example.com/file2.html
Hướng dẫn về text file sitemap:
- Mã hóa file của bạn bằng UTF-8.
- File text của bạn không nên chứa gì ngoài danh sách URL.
- Bạn có thể đặt tên file text là bất cứ điều gì mà bạn muốn miễn là nó có đuôi .txt (ví dụ sitemap.txt).
+ Google sites
Nếu bạn đã tạo và xác minh trang web bằng Google Sites, Google Sites sẽ tự động tạo một sitemap cho bạn. Bạn không thể sửa đổi sitemap nhưng bạn có thể gửi nó tới Google nếu bạn muốn đọc báo cáo dữ liệu trong siteamap. Lưu ý rằng Sitemap của bạn có thể không được hiển thị đúng nếu bạn có hơn 1.000 trang trong một thư mục con.
- Nếu trang web của bạn được lưu trữ tại Google Sites, URL sitemap của bạn sẽ là http://sites.google.com/site/yoursitename/system/feeds/sitemap
- Nếu bạn đã tạo trang web của mình bằng Google Apps, URL sitemap của bạn sẽ là http://sites.google.com/yourdomain/yoursitename/system/feeds/sitema
Hướng dẫn tổng quan về Sitemap
- Sử dụng URL phù hợp, đủ điều kiện: Google sẽ thu thập dữ liệu URL của bạn chính xác như đã được liệt kê. Ví dụ: nếu trang web của bạn là http://www.example.com/, đừng chỉ định một URL kiểu như /http://example.com/ (không có www) hoặc ./mypage.html (một URL tương đối ).
- Không bao gồm ID phiên từ URL trong sitemap của bạn để giảm quá trình thu thập thông tin từ các URL đó.
- Chỉ ra phiên bản dịch của một URL cho Google để thu thập thông tin và lập chỉ mục bằng cách liệt kê các URL chuẩn cho mỗi ngôn ngữ trong file sitemap của bạn hoặc bằng cách sử dụng các chú thích hreflang.
- Các file sitemap phải được mã hoá UTF-8.
- Chia nhỏ các sitemap lớn thành các sitemap nhỏ hơn để ngăn không cho máy chủ của bạn bị quá tải nếu Google thường xuyên yêu cầu sitemap của bạn. File sitemap không thể chứa quá 50.000 URL và không được lớn hơn 50 MB (không nén).
- Sử dụng file chỉ mục sitemap để liệt kê tất cả các sitemap của bạn và gửi file này tới Google thay vì gửi các sitemap riêng lẻ.
- Sử dụng các phương pháp chuẩn để nói với Google nếu trang web của bạn có thể truy cập được trên cả phiên bản www và không www trong tên miền của bạn. Bạn cần gửi sitemap với tên miền ưa thích của mình.
Mở rộng sitemap cho các loại phương tiện khác
Google hỗ trợ mở rộng sitemap cho các loại phương tiện truyền thông sau. Sử dụng các tiện ích này để mô tả các file video, hình ảnh và các nội dung khó phân tích khác trên trang web của bạn để cải thiện việc lập chỉ mục.
+ Video.
+ Hình ảnh.
+ Tin tức.
Làm cho sitemap của bạn trở nên khả dụng với Google (gửi sitemap của bạn đến Google)
Có 2 cách khác nhau để làm cho sitemap trở nên khả dụng với Google:
+ Gửi nó đến Google bằng cách sử dụng công cụ sitemap trong Google Search Console.
+ Chèn dòng sau vào bất cứ đâu trong file robot.txt, chỉ định đường dẫn đến sitemap của bạn:
Sitemap: http://example.com/sitemap_location.xml