Tạo Sitemap cho website

Các trình thu thập Web thường khám phá các trang từ các liên kết trong trang web ( Internal link ) và từ các trang web khác ( backlink ). Sitemap bổ sung dữ liệu này để cho phép trình thu thập dữ liệu của công cụ tìm kiếm tìm hiểu kỹ hơn về những URL với các siêu dữ liệu liên quan. Sử dụng Sitemap không đảm bảo rằng các trang web được index, nhưng là cách dễ nhất cung cấp gợi ý cho trình thu thập web để công cụ tìm kiếm làm việc tốt hơn khi thu thập dữ liệu trang web của bạn.

Mục lục

Những người làm việc liên quan đến  thiết kế web đều biết đến khái niệm Sitemap cho Website. Nhưng đa số ( thậm chí là dân kỹ thuật ) không biết tác dụng thực sự của Sitemap trong làm Seo.

Sitemap cho website

Sitemap là gì?

Sitemap ( bản đồ trang web hoặc sơ đồ trang web ) là một danh sách các trang của một trang web được thiết kế dành cho trình thu thập dữ liệu hoặc người sử dụng . Nó có thể là một tài liệu dưới hình thức bất kỳ được sử dụng như một công cụ lập kế hoạch thiết kế web, hoặc là một page liệt kê các trang trên một trang web, thường tổ chức theo thứ tự thời gian. Sitemap Điều này giúp du khách và công cụ tìm kiếm dễ dàng tìm thấy các trang trên trang web.“Bản đồ trang”, là thể các tổng quan về hệ thống  website của bạn. Sitemap hường được lưu trữ dưới định dạng XML, hoặc HTML trên website.

Theo một định nghĩa khác từ  sitemaps.org ( được Google lấy làm chuẩn ), mang tính chất kỹ thuật hơn thì:

Sitemap là cách dễ dàng khi  webmaster muốn thông báo cho công cụ tìm kiếm về các trang trên trang web của họ. Hình thức đơn giản nhất của Sitemap là một tập tin XML liệt kê các URL của một trang web cùng với siêu dữ liệu bổ sung về mỗi URL (thời điểm được cập nhật lần cuối, mức độ thường xuyên thay đổi, mức độ quan trọng như thế nào, so với các URL khác trong trang web ) để các công cụ tìm kiếm có thể thu thập dữ liệu trang web một cách thông minh hơn.

Các trình thu thập Web thường khám phá các trang từ các liên kết trong trang web ( Internal link ) và từ các trang web khác ( backlink ). Sitemap bổ sung dữ liệu này để cho phép trình thu thập dữ liệu của công cụ tìm kiếm tìm hiểu kỹ hơn về những URL với các siêu dữ liệu liên quan. Sử dụng Sitemap không đảm bảo rằng các trang web được index, nhưng là cách dễ nhất cung cấp gợi ý cho trình thu thập     web để công cụ tìm kiếm làm việc tốt hơn khi thu thập dữ liệu trang web của bạn.

HTML sitemap

  • Cấu trúc: HTML sitemap liệt kê tất cả các liên kết URL trong từng phần hay từng trang khác nhau của Blog hay   Website.
  • Thứ tự: URL được liệt kê sắp xếp theo thứ tự thư mục và hiển thị theo tiêu đề trang.
  • Đối tượng: HTML sitemap giúp người dùng di chuyển và tìm được thông tin dễ dàng.

XML sitemap

  • Cấu trúc: XML sitemap hiển thị danh sách các URLs của blog hay Website theo chuẩn đặc biệt XML. Tham khảo (   Sitemap trên wikipedia ).
  • Thứ tự: URL được liệt kê theo thứ tự ưu tiên tùy vào tiêu chí của Webmaster.
  • Đối tượng: XML sitemap cho phép Webmaster thông báo tới Google về các URLs trên blog hay Website nhằm tạo thuận lợi cho quá trình index.

Ví dụ:

  • HTML Sitemap: http://www.google.com/sitemap.html
  • XML Sitemap: /sitemap.xml

Sitemap hữu ích khi nào?

  • Trang web của bạn có nội dung động.
  • Trang web của bạn không thuận lợi cho Googlebot thu thập dữ liệu ví dụ, các trang AJAX hoặc hình ảnh phong phú.
  • Trang web của bạn là mới.
  • Trang web của bạn có một kho lưu trữ lớn của các trang nội dung không được liên kết với nhau.

Cách tạo sitemap

Nếu bạn dùng wordpress thì đơn giản là sử dụng  Plugin Google XML Sitemaps. Nếu không, vào web này tạo sitemap online https://www.xml-sitemaps.com/

Tạo sitemap bằng “tay”

Google có thể chấp nhận Sitemap trong một số định dạng, nhưng chúng tôi khuyên bạn nên tạo một Sitemap dựa trên giao thức Sitemap bởi vì cùng một định dạng có thể được hầu hết các công cụ tìm kiếm khác như Bing và Yahoo chấp nhận ( Những công cụ là thành viên của sitemaps.org).

Ví dụ về Sitemap cơ bản với một mục duy nhất cho một URL bao gồm hình ảnh và video

sitemap

Bạn có thể tạo Sitemap của bạn bằng tay hoặc công cụ của bên thứ ba. Ngoài định dạng tiêu chuẩn nêu trên, Google cũng chấp nhận một số định dạng sau:

  • RSS, mRSS và Atom 1.0 : Google chấp nhận RSS (Real Simple Syndication) 2.0 và Atom 1.0 nguồn cấp dữ liệu . Nếu bạn có một blog với một nguồn cấp dữ liệu RSS hoặc Atom, bạn gửi URL của nguồn cấp dữ liệu như một Sitemap. Hầu hết Blog đều có nguồn cấp dữ liệu. Lưu ý rằng nguồn cấp dữ liệu chỉ có thể cung cấp thông tin trên các URL gần đây. Ngoài ra, bạn có thể sử dụng một mRSS (phương tiện truyền thông RSS) Feed để cung cấp cho Google với các chi tiết về nội dung video trên trang web của bạn.
  • Tập tin văn bản : Sitemap cơ bản (Sitemap bao gồm chỉ URL trang web, chứ không phải hình ảnh, video, hoặc các dữ liệu specalized khác), bạn có thể cung cấp cho Google với một tập tin văn bản đơn giản có chứa một URL trên mỗi dòng.

Ví dụ:

  • http://www.example.com/file1.html
  • http://www.example.com/file2.html

Để tạo Sitemap bằng công cụ của bên thứ 3 ( theo giới thiệu của Google ) bạn follow link sau:

http://code.google.com/p/sitemap-generators/wiki/SitemapGenerators

Công cụ miễn phí mà thietkewebchuanseo hay dùng là   http://www.xml-sitemaps.com/

Tuy nhiên nó chỉ craw được tối đa 500 link, nếu website của bạn nhiều hơn 500link thì cần mua bộ công cụ. Nếu không muốn mua thì liên hệ thietkewebchuanseo để được share:D

Một số chú ý khi tạo sitemap

  • Một tập tin Sitemap không thể chứa hơn 50.000 URLs và không được lớn hơn 50MB khi được giải nén. Nếu Sơ đồ trang web của bạn lớn cỡ này, chia nó thành các file sitemap nhỏ hơn. Các giới hạn này đảm bảo cho máy chủ web của bạn không bị quá tải phục vụ các tập tin lớn cho Google.
  • Nếu bạn có nhiều hơn một Sơ đồ trang web, bạn có thể liệt kê chúng trong một   tập tin chỉ mục sitemap.
  • Nếu URL mặc định của website là http://www.example.com/thì URL trong sitemap cũng phải có định dạng như vậy.
  • URL trong sitemap không được chứa ID
  • Sitemap của bạn phải xác định không gian tên XML sau : xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9" .
  • URL Sitemap phải được mã hóa  UTF8 , và mã hóa cho dễ đọc với các máy chủ web.
  • Nếu trang web của bạn có thể truy cập trên cả hai phiên bản www và không www của tên miền của bạn, bạn không cần phải gửi Sitemap riêng biệt cho mỗi phiên bản.
  • Mỗi Sitepmap độc ​​lập với mỗi ngôn ngữ của nội dung. Hãy đảm bảo rằng mỗi phiên bản ngôn ngữ có thể được thu thập dữ liệu và lập chỉ mục, sử dụng các URL duy nhất. URL này có thể được bao gồm trong các Sitemap

Các loại Sitemap khác

Thông qua các sitemap phụ này, Google có thể thu nhập dữ liệu theo những cách phù hợp hơn với các loại website đặc biệt như website tin tức, website sử dụng media là nội dung chính (website dịch vụ ảnh cưới, website bán hình ảnh, video…), …

  • Sitemap Index: Tập hợp các Sitemap được đính kèm và được dùng để đặt trong file robots.txt
  • Sitemap-category.xml: Tập hợp cấu trúc của các danh mục trên website.
  • Sitemap-products.xml: Sitemap dành cho các link chi tiết về các sản phẩm trên trang.
  • Sitemap-articles.xml: Sitemap dành cho các link chi tiết của từng bài viết trên website.
  • Sitemap-tags.xml: Sitemap dành cho các thẻ trên website.
  • Sitemap-video.xml: Sitemap dành riêng cho video trên các page, website.
  • Sitemap-image.xml: Sitemap dành cho các link về hình ảnh.

Để giúp bạn tiết kiệm thời gian trong việc xây dựng các website có cấu trúc đặc biệt, Mona Media cung cấp gói thiết kế website theo mẫu đã được tối ưu chuẩn SEO 100%.

Các website nào cần dùng XML Sitemap?

Theo Google, nếu website của bạn là một website bình thường không có quá nhiều trang hoặc quá nhiều media và các trang được liên kết với nhau đúng cách thì bot vẫn sẽ dễ dàng tiếp cận toàn bộ trang trên website mà không cần Sitemap.

Tuy nhiên Sitemap vẫn là một trong những tiêu chí giúp tối ưu SEO và trong một số trường hợp đặc biệt, sitemap có vai trò rất quan trọng như:

  • Các website mới hoặc website đã có nhiều nội dung nhưng không xây dựng hệ thống link liên kết nội bộ (internal link) nên tạo XML Sitemap ngay để được Google Index (lập chỉ mục) nhanh hơn
    Tham khảo: Những cách giúp Google Index nhanh hơn
  • Một website thương mại điện tử sở hữu nhiều danh mục lớn và hàng trăm danh mục con. Tạo sitemap cho website sẽ giúp bot crawl hiệu quả hơn và hiển thị kết quả tìm kiếm sản phẩm chính xác hơn
  • Nếu bài viết của bạn bị copy hoặc được dùng để trích dẫn cho nhiều website thì Sitemap có thể chứng minh cho Google rằng bài viết của bạn là bài viết gốc với các thông tin lưu trữ tại Sitemap

Sitemap có tốt cho SEO?

  • Giúp người dùng dễ sử dụng website hơn, là một trong những yếu tố được Google đánh giá cao vì Google đã khẳng định rằng trải nghiệm người dùng tốt sẽ ảnh hưởng tích cực đến thứ hạng của bạn trên trang tìm kiếm.
  • Không chỉ vậy có thêm sự xuất hiện của các keywords chính giúp bạn có thêm lợi thế cạnh tranh thứ hạng

Ảnh hưởng đến quá trình SEO

Sitemap trong website có ảnh hưởng đến quá trình SEO website của bạn. Nó góp phần thông báo cho công cụ tìm kiếm Google biết rằng, trang web của bạn có chuẩn SEO.

VD: Bạn có một số bài viết trên website nhưng lại không (hoặc chưa) được Index. Vậy trong trường hợp đó, Sitemap chính là công cụ khai báo cho Google về bài viết này. Từ đó, Google sẽ Index cho những bài viết này nhanh chóng hơn.

Giúp Google index website mới nhanh hơn

Sitemap sẽ rất hữu ích cho các website mới vừa thành lập.

Những website mới này luôn gặp nhiều khó khăn về vấn đề Index, do có quá ít backlink trở về. Vậy, Sitemap sẽ rất hữu ích cho các bot của bộ máy tìm kiếm lùng sục trong Site của bạn để lập Index, vì nó thay bạn thông báo với Google vào Index website của bạn, đem lại lợi ích cho chiến lược SEO.

Hỗ trợ trải nghiệm người dùng khi website có sitemap

Về phương diện người sử dụng, Sitemap trong website giúp cho người truy cập có thể định hình và hiểu được cấu trúc của trang web rõ hơn, đồng thời có thể truy cập và tìm kiếm thông tin mà họ cần một cách chính xác nhất.

Sitemap càng chi tiết, phân cấp càng rõ ràng thì khả năng gia tăng trải nghiệm, thu hút người dùng càng cao.

Hiện tại chúng tôi đang có chương trình khuyến mãi thiết kế web được thiết kế logo miễn phí + tên miền + hosting + hướng dẫn quảng cáo seo tổng thể marketing online miễn phí. Hãy liên hệ chúng tôi để biết thêm chi tiết. 

Henry Hoàng
Henry Hoàng
Chuyên gia SEO Henry Hoàng. Có nhiều năm kinh nghiệm trong lĩnh vực seo, cải thiện % CTR cho website, nhằm tăng tỉ lệ chuyển đổi. Phân tích đánh giá độ cạnh tranh từ khóa, từ đó đưa ra định hướng SEO phù hợp. Xem thêm
FollowAction (12114) - LikeAction (12314) - WriteAction (900)