Tạo sơ đồ trang web (Sitemap) dành cho tin tức trong Google Webmaster Tools

Trước khi bắt đầu bạn hãy chắc chắn rằng trang web của bạn đã được đưa vào Google News, nếu không bạn có thể đăng kí để đưa vào trong Google.

Hướng dẫn cơ bản về sơ đồ trang web dành cho tin tức

Khi bạn tạo sơ đồ trang web tin tức, hãy ghi nhớ các yêu cầu sau:

  • Sơ đồ trang web dành cho tin tức của bạn chỉ nên chứa các URL của các bài viết được xuất bản trong hai ngày qua. Bạn có thể xóa các bài viết cũ hơn hai ngày từ sitemap tin tức nhưng chúng vẫn nằm trong phần chỉ mục Tin tức trong khoảng 30 ngày.
  • Bạn được khuyến khích cập nhật sơ đồ trang web dành cho tin tức liên tục với các bài viết mới khi chúng vừa được xuất bản. Google News thu thập thông tin sơ đồ trang web dành cho tin tức thường xuyên như khi thu thập thông tin cho phần còn lại của trang web.
  • Sơ đồ trang web dành cho tin tức có thể chứa không quá 1000 URL. Nếu bạn muốn chứa nhiều hơn, bạn có thể chia các URL này thành nhiều sơ đồ trang web khác và sử dụng file chỉ mục sơ đồ trang web để quản lý chúng. Sử dụng định dạng XML được cung cấp trong sitemap protocol. File chỉ mục sơ đồ trang web của bạn không được liệt kê quá 5000 sơ đồ trang web. Những giới hạn này giúp đảm bảo rằng máy chủ web của bạn sẽ không bị quá tải bởi các file lớn tới Google News.
  • Khi bạn xuất bản các bài viết mới, không tạo sơ đồ trang web tin tức mới mà thay vào đó, cập nhật sơ đồ trang web hiện tại của bạn với các URL của các bài viết mới.
  • Google Sitemap Generator không được dùng để tạo sơ đồ trang web dành cho tin tức vì nó sẽ bao gồm các URL không tương ứng với các bài viết cụ thể. Có một số công cụ của bên thứ ba có thể giúp bạn tạo sơ đồ trang web dành cho tin tức.

Ví dụ về sitemap dành cho tin tức

Sơ đồ trang web sử dụng sitemap protocol với các thẻ được dành riêng cho tin tức được định nghĩa như ở bên dưới. Đây là ví dụ về một sơ đồ trang web tin tức sử dụng các thẻ dành riêng cho tin tức:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
   <url>
     <loc>http://www.example.org/business/article55.html</loc>
     <news:news>
        <news:publication>
        <news:name>The Example Times</news:name>
        <news:language>en</news:language>
     </news:publication>
     <news:genres>PressRelease, Blog</news:genres>
     <news:publication_date>2008-12-23</news:publication_date>
     <news:title>Companies A, B in Merger Talks</news:title>
     <news:keywords>business, merger, acquisition, A, B</news:keywords>
     <news:stock_tickers>NASDAQ:A, NASDAQ:B</news:stock_tickers>
   </news:news>
 </url>
</urlset>

Định nghĩa các thẻ dành riêng cho tin tức

 Thẻ  Yêu cầu  Mô tả
 <publication>  Có  Thẻ <publication> để chỉ ra việc xuất bản của các bài viết, tin tức. Nó có 2 thẻ con băt buộc là <name><language>. Thẻ <name> là tên của bài viết, nó phải giống với tên trong news.google.com (bỏ qua các dấu ngoặc đơn). Thẻ <language> là ngôn ngữ trong bài viết của bạn.
 <genres>  Tùy chọn Danh sách các thuộc tính đặc trưng của nội dung bài viết được phân cách bằng dấu phẩy. Các giá trị hợp lệ bao gồm: Blog, OpEd, Opinion, PressRelease, Satire, và UserGenerated. Vì thẻ này áp dụng cho một bài báo riêng lẻ, nó không có hiệu lực trên các mã nguồn.
 <publication_date>  Có Ngày xuất bản bài viết ở định dạng W3C, sử dụng định dạng “đầy đủ ngày tháng” (YYYY-MM-DD) hoặc định dạng “đầy đủ ngày tháng cộng với giờ, phút và giây” với thiết kế định dạng múi giờ  (YYYY-MM-DDThh: mm: ssTZD). Hãy đảm bảo rằng bạn đưa thông tin ngày và thời gian ban đầu của bài viết được xuất bản trên trang web của bạn chứ không phải thời gian bài viết được thêm vào sơ đồ trang web của bạn.

Trình thu thập thông tin của Google chấp nhận các định dạng sau:

+ Đầy đủ ngày tháng: YYYY-MM-DD (ví dụ 2017-07-27)

+ Đầy đủ ngày tháng cộng với giờ và phút:

YYYY-MM-DDThh:mmTZD (ví dụ: 2017-07-27T19:20+07:00)

+ Đầy đủ ngày tháng cộng với giờ, phút và giây:

YYYY-MM-DDThh:mm:ssTZD (ví dụ: 2017-07-27T19:20:30+07:00)

+ Đầy đủ ngày tháng cộng với giờ, phút và giây và một phần thập phân của giây:

YYYY-MM-DDThh:mm:ss.sTZD (ví dụ: 2017-07-27T19:20:30.45+07:00)

 <title>  Có  Tiêu đề của một bài viết. Lưu ý: tiêu đề có thể bị rút gọn do dài hơn mức độ cho phép khi hiển thị trong Google News. Thẻ tiêu đề của bài viết chỉ nên bao gồm tiêu đề của bài như khi nó xuất hiện trên trang web của bạn. Hãy đảm bảo không bao gồm tên tác giả, ngày tháng xuất bản…
 <keywords>  Không Danh sách từ khóa được phân cách bằng dấu phẩy mô tả chủ đề của bài viết. Từ khoá có thể được rút ra từ danh sách từ khóa hiện tại của Google News.

Leave a Reply

Your email address will not be published. Required fields are marked *