Làm sao để Google index website

Cập nhật nội dung thường xuyên, đều đặn, hạn chế đi  "leech" bài và copy bài, nên lên kế hoạch viết bài đều đặn cho từng chuyên mục. Google đánh giá cao Website của bạn và tăng tần suất index nếu  nội dung được thay đổi cập nhật thường xuyên và hữu ích.

Mục lục

Câu hỏi làm sao để website được các máy tìm kiếm như Google, Yahoo, Bing được lập chỉ mục (index) nhanh nhất, là băn khoăn của không chỉ các seoer mới vào nghề, mà hầu như của tất cả những ai đang làm công việc liên quan đến quảng bá website.

Bài viết này, chia sẻ cách thức để website được lập chỉ mục thường xuyên và tần suất cao.

Làm cách nào để website được index nhanh nhất

Spider, Craeler Google

Thứ nhất: Website phải tối ưu, có tốc độ load cao, bố trí cấu trúc site hợp lý, internal links tổ chức khéo trong phần thể hiện hiện dung.

Thứ hai: Tăng cường số lượng backlinks trên các diễn đàn cùng chủ để, hoặc các trang có lượng dữ liệu lớn và page rank cao.

Thứ ba: Cập nhật nội dung thường xuyên, đều đặn, hạn chế đi  "leech" bài và copy bài, nên lên kế hoạch viết bài đều đặn cho từng chuyên mục . Google đánh giá cao Website của bạn và tăng tần suất index nếu  nội dung được thay đổi cập nhật thường xuyên và hữu ích.

Thứ tư: Kiểm tra tình trạng trùng lặp nội dung, trùng lặp tiêu đề, trùng lặp mô tả. Tránh sảy ra các tình trạng trùng lặp trên, vì các máy tìm kiếm sẽ cho rằng bạn đang có tình spam từ khóa.

Thứ năm: Tạo sitemap cả hai phiên bản xml và html, bản xml là để khai báo với các máy tìm kiếm mỗi khi có bài viết mới, html là để cho người dùng tiện truy cập trang của bạn.

   http://www.google.com/webmasters/sitemaps/ping?sitemap=/sitemap.xml

   http://search.yahooapis.com/SiteExplorerService/V1/updateNotification?appid=YahooDemo&url=/sitemap.xml

   http://www.bing.com/webmaster/ping.aspx?siteMap=/sitemap.xml

Thứ sáu: Điều chỉnh lưu lượng tần suất index hay crawl đối với  Google Webmaster Tool, các yếu tố để điều chỉnh

  • Xem xét khả năng băng thông của  hosting.
  • Xem xét khả năng cập nhật dữ liệu Website của bạn. Với những site bình thường cập nhật mỗi ngày 1 - 5 bài viết, nên chọn chế độ tần suất 0.01 yêu cầu mỗi giây tương đương với chu kỳ 100 giây một yêu cầu.
  • Xem thêm cách seo từ khóa lên top google.

Làm sao để website mới được Google biết đến nhanh nhất?

Dưới đây là 1 số phương án tốt

  • Tạo sitemap: đây là dạng văn bản XML trên server, về cơ bản là nó sẽ có chứa tất cả các trang - page trên website. Qua sitemap, các Search Engine sẽ được thông báo mỗi khi có page mới, tần suất kiểm tra mỗi khi có sự thây đổi trên page. Ví dụ: nếu bạn muốn Search Engine quay lại và kiểm tra homage website bạn hàng ngày, trong trường hợp website được xây dừng bằng WordPress thì có thể tham khảo và sử dụng Google XML Sitemaps Plugin hoặc công cụ XML Sitemaps Generator.
  • Submit phần sitemap này đến Google Webmaster Tools: đây là nơi đầu tiên mà bạn mang dữ liệu sitemap của website mới lên, đó là Google Webmaster Tools. Google Webmaster Tools này sẽ được khởi tạo và thiết lập bằng tài khoản Google. Quá trình submit website mới lên Webmaster Tools qua menu Optimization > Sitemaps, bạn copy và paste link sitemap của website vào đây để thông báo với Google rằng page của bạn đã sẵn sàng. Một công cụ khác có thể được tham khảo và sử dụng là Webmaster Tools của Bing.
  • Cài đặt Google Analytics: công cụ này giúp bạn theo dõi rất nhiều chi tiết của website.
  • Submit URL của website đến Search Engine: có 1 số lời khuyên cho rằng chúng ta không nên làm việc này bởi vì bên cạnh đó có nhiều cách khác để Search Engine craw nội dung website. Nhưng thực ra không phải, việc làm này không tốn quá nhiều thời gian, là lại rất có lợi. Đăng nhập vào Google Webmaster Tools và submit đường dẫn - URL website bạn đến form qua menu Submit URL, menu submit tương tự trên Bing.
  • Tạo mới hoặc liên tục cập nhật Profile Social của website: như đã đề cập ở bên trên, crawler biết đến website của bạn qua các đường dẫn - Link. Và việc tạo ra những profile social cũng là giải pháp không tệ để thúc đẩy nhanh quá trình craw này. Nếu đặt những link này ở chế độ nofollow, thì chúng vẫn thông báo với các Search Engine rằng có dấu hiệu, tín hiệu của mạng xã hội và cần bám theo. Với Pinterest, việc gắn 1 tấm ảnh từ website đến kênh YouTube, thì hãy tạo 1 video hướng dẫn, giới thiệu đến website của bạn, kèm theo đó là link giới thiệu trong phần mô tả - Description của video.
  • Chia sẻ rộng rãi link website: hãy cho đi nhiều hơn, và bạn sẽ nhận lại nhiều hơn nữa. Giống như việc áp dụng mô hình AIDA từ Marketting vào SEO cũng vậy.
  • Sử dụng Bookmark: tham khảo và dùng một số site như Delicious hoặc StumpleUpon.
  • Tạo content tốt, chất lượng: luôn là tiêu chí hàng đầu. Hạn chế copy paste, hãy đầu tư chất xám và áp dụng các chuẩn SEO vào bài viết của bạn.

Bên cạnh đó, còn một số phương án bạn có thể tham khảo thêm:

  • Thiết lập RSS với FeedBurner: đây là công cụ quản lý RSS chính của Google, tất cả những gì bạn cần làm là đăng nhập bằng tài khoản Google, submit phần feed website của bạn với Feedburner bằng cách copy URL của website, blog hoặc đường dẫn RSS vào phần Burn a feed.
  • Submit đến Blog Directories: TopRank có 1 số lượng danh sách website khổng lồ mà bạn hoàn toàn có thể dùng để submit RSS feed và blog đến đó. Bên cạnh đó là Technorati hoặc Alltop.

Googlebot, Crawling, và Indexing là gì?

Mỗi người hiểu 1 ý, 1 cách khác nhau nhưng trước khi bắt đầu, hãy cùng tìm hiểu về các thuật ngữ trên.

  • Googlebot: đơn giản là phần mềm tìm kiếm của Google tung ra để thu thập thông tin về văn bản, dữ liệu website, và sau đó thêm vào những mục mà Google Search có thể lập Index được.
  • Craw là quá trình thu thập, lấy dữ liệu từ những nơi mà con Googlebot mò tới, từ những bài cũ, những bài mới, thông tin mới update - cập nhật và tạo báo cáo ngược lại với Google. Googlebot tìm những thông tin cần craw qua các URL, đường dẫn website, bài viết.
  • Index là quá trình xử lý dữ liệu, thông tin được thu thập bởi Googlebot từ hành động craw của chúng. Mỗi khi văn bản, bài viết nào đó được xử lý, chúng sẽ được thêm vào mục Index mà có thể được tìm kiếm bởi Google, tất nhiên những phần nội dung này phải nằm trong tiêu chuẩn chất lượng cho phép của Google. Nghĩa là gì? Nghĩa là Google sẽ tiến hành so sánh phần nội dung bài viết đó với các tiêu chuẩn của Google và đưa quyết định có craw phần nội dung đó hay không? Quá trình này được thực hiện như thế nào? Trong khi Index, Googlebot sẽ tiến hành xử lý các từ ngữ trên trang đó, và xác định vị trí những từ đó (ở đây là từ khóa), các thông tin khác như title tag, thẻ ALT cũng sẽ được phân tích và lập Index.

Vậy chính xác thì làm thế nào mà Googlebot có thể tìm được phần nội dung mới trên các bài viết, trang mới, website mới? Nó sẽ tiến hành so sánh dữ liệu với các lần craw trước đó của website, đồng thời gán vào dữ liệu sitemap được cung cấp bởi webmaster.

Vậy là, ta có thể hiểu nôm na rằng phần content - nội dung mới trên website được tìm kiếm và phát hiện qua sitemap và link. Bước tiếp theo, ta sẽ cùng tìm hiểu thêm làm thế nào để Googlebot nhanh chóng biết đến sitemap và link mới này.

Hiện tại chúng tôi đang có chương trình khuyến mãi thiết kế web được thiết kế logo miễn phí + tên miền + hosting + hướng dẫn quảng cáo seo tổng thể marketing online miễn phí. Hãy liên hệ chúng tôi để biết thêm chi tiết.

Henry Hoàng
Henry Hoàng
Chuyên gia SEO Henry Hoàng. Có nhiều năm kinh nghiệm trong lĩnh vực seo, cải thiện % CTR cho website, nhằm tăng tỉ lệ chuyển đổi. Phân tích đánh giá độ cạnh tranh từ khóa, từ đó đưa ra định hướng SEO phù hợp. Xem thêm
FollowAction (12570) - LikeAction (12770) - WriteAction (900)