Thiết kế web chuẩn seo

Cách Google tìm kiếm sắp xếp thứ hạng website

"Lọc 1 trang sách rất dễ nhưng với hàng tỷ trang web thì nó lọc và sắp xếp nó sẽ là khối lượng công việc khổng lồ. Google giải quyết bài toán này qua thư viện từ vựng, xây dựng cơ chế chạy song song cho phép xử lý hàng trăm nghìn luồng 1 lúc. Giúp họ sắp xếp toàn bộ các trang website trên thế giới 1 cách nhanh chóng hơn."

Tìm thông tin – Web Crawling, Lập chỉ mục – Indexing, Xếp hạng – Ranking...Là các giai đoạn tìm kiếm thông tin của Google

Google là cỗ máy tìm kiếm lớn nhất thế giới hiện nay, thuật toán và quy trình tìm kiếm dữ liệu website của nó đã được phát triển rất tối ưu. Trong bài viết này tôi sẽ mô tả quy trình tìm kiếm thông tin của Google. Bạn hiểu được quy trình này nó sẽ hỗ trợ rất nhiều cho bạn trong quá hình học và làm SEO.

Matt Cutt mô tả quá trình tìm kiếm của Google

Mattcutt đã có 1 video mô tả quá trình tìm kiếm của Google, các bạn có thể bật CC để xem bản dịch tiếng việt.

Những điều nên biết

  1. Khi bạn tìm kiếm không phải tìm trực tiếp trên Internet mà đang tìm dữ liệu trong Sever của Google.
  2. Google sử dụng phần mềm tìm kiếm thông tin trên Internet gọi là Spider.
  3. Spider di chuyển giữa các trang web thông qua Link.
  4. Google sử dụng thuật toán để sắp xếp và đưa những kết quả tốt nhất có thể và cho hiển thị lên trên  top 10.

Các giai đoạn tìm kiếm thông tin của Google

Bước 1: Tìm thông tin – Web Crawling

Google bot tìm kiếm thông tin, tin tức mới và những trang web được thiết kế mới theo các nguồn:

1. Khám phá qua link – Discovery Craw

Tưởng tượng Internet như 1 hệ thống xe buýt trong thành phố, mỗi điểm dừng là 1 tài liệu (bài viết, hình ảnh, file pdf,…). Nhiệm vụ của SE bot là phải đi qua hết các điểm này để thu thập thông tin. Giống như tuyến đường xe buýt, sẽ dẫn ta từ điểm A -> điểm B. Các Link liên kết giúp SE Bot đi từ webpage này sang webpage khác.

Khám phá qua link – Discovery Craw

2. Khám phá qua Sitemaps – Sitemap Crawl

Làm sao website của bạn được Google crawl nếu như nó không có backlink nào cả? Để giải quyết vấn đề này Google phát hiện url mới thông qua việc submit sitemaps trên Google webmaster tool,  hoặc HTTP request >> www.google.com/addurl.html.

Khám phá qua Sitemaps – Sitemap Crawl

Lọc link với Spam Filter

Quá trình tìm nội dung mới được Google thực hiện thường xuyên. Tuy nhiên spider không chạy theo các liên kết 1 cách ngẫu nhiên mà đi theo 1 thứ tự ưu tiên. SE bot sẽ quét dữ liệu trong các Danh bạ website lớn (dmoz, yahoo,…) – nơi có nhiều website, thường được update  website mới -> Nhóm 1.

SE Bot tiếp tục tìm các link trong Nhóm 1 để tìm liên kết ngoài và đưa các link này -> nhóm 2.  Toàn bộ các url này sẽ được quăng sang quá trình tiếp theo là Spam Filter để lọc các liên kết trùng lặp, hỏng. Trong quá trình này, nếu như những link đến bị lỗi (không truy cập được) nó sẽ được đưa lại quá trình Discovery Crawl. Tìm hiểu về thiet ke website

Giai đoạn 2: Lập chỉ mục – Indexing.

Các URL sạch có được sau quá trình Spam Filter sẽ được Google tung web cralwer vào để thu thập nội dung và xây dựng chỉ mục.

Đầu tiên Google phải thu thập nội dung trong website bằng cách sử dụng web crawler. Web Crawler tạo ra các HTTP request để truy cập vào website rồi bắt đầu thực hiện quá trình thu (retrieve) dữ liệu trên các trang đó. (Trong lúc này URL mới được nó phát hiện ra sẽ tiếp tục được đưa trở lại bước Discovery Crawl).

Sau khi có được dữ liệu phải làm bước tiếp theo là phân tích cú pháp để xác định nội dung của webpage.

Parsing – phân tích cú pháp: Parsing cho phép Google loại bỏ các từ phổ biến (và, thì,mà, là,…), loại bỏ các khoảng trống,  con số để kết hợp các từ thành cụm từ lại thành có ý nghĩa.

Lọc 1 trang sách rất dễ nhưng với hàng tỷ trang web thì nó lọc và sắp xếp nó sẽ là khối lượng công việc khổng lồ. Google giải quyết bài toán này qua thư viện từ vựng, xây dựng cơ chế chạy song song cho phép xử lý hàng trăm nghìn luồng 1 lúc. Giúp họ sắp xếp toàn bộ các trang website trên thế giới 1 cách nhanh chóng hơn.

Sau khi 1 webpage qua bước Parsing nó sẽ được đánh dấu và cho vào 1 box riêng được mã hóa theo ID. Nó được phân loại theo nhiều cách khác nhau (khu vực, loại ngôn ngữ, chủ đề,…) để nhanh chóng nhất hiển thị ra khi có truy vấn tìm kiếm liên quan đến nó (từ khóa) – thông thường dưới 1s.

Bạn có biết ?

Cản trở lớn nhất cho Google trong Quá trình này đó là các lỗi html. Khi gặp lỗi Google không thể tự xử lý ngày mà phải dùng thuật toán để xác định lại. Điều này sẽ làm web của bạn sẽ bị chậm trễ khi index và đôi khi sẽ đưa ra kết quả sai.

Nên hãy xử lý triệt để các lỗi html nếu có trong website.

Giai đoạn 3:  Xếp hạng – Ranking

Sau khi website của bạn đã được index trong data center của Google. Nó sẽ được đánh giá và xếp hạng để hiển thị ra ngoài trang kết quả tìm kiếm (SERP) thông qua thuật toán của Google.

Nhân tố On-Page – mức độ quan trọng.

Bảng dưới đây là các nhân tố cơ bản và có ảnh hưởng cao nhất tới thuật toán xếp hạng của máy tìm kiếm, được đánh giá theo thang điểm 5.

  • Title Tags  - 4.9/5
  • Mật độ & tần suất của từ khóa – 3.7 /5
  • Từ khóa trong Heading (h1, h2,h3): h1 – 3.1/5; h2 – 2.8/5.
  • Từ khóa trong URL 2.8/5
  • Từ khóa trong Meta Description – 2/5.
Dễ dàng bạn có thể nhận thấy các nhân tố Onpage được ứng dụng để hỗ trợ trong quá trình Parsing. Những từ khóa được làm nổi bật, xuất hiện trên những điểm nóng, có tần suất, mật độ xuất hiện cao. Giúp Google dễ dàng nhận biết được đâu là từ khóa chính, cụm từ chính để sắp xếp và phân loại website.

Nhân tố Off-PageLink anchor text contains keyword = 4.4/5

  • Back link từ trang có PR cao 4/5
  •  Mức độ phổ biến của link liên kết trong trang (Internal Link)=4/5
  • Mức độ quan trọng của Page 3.5/5
  • Page assessed as an authority = 3.5/5
  • Tốc độ xây dựng liên kết* = 3.5/5

Các nhân tố Offpage liên quan rất nhiều đến việc xếp hạng website. Các Anchortext Link, Internal Link, Link velocity giúp Google tìm ra những trang đích có chất lượng và được đánh giá cao (có nhiều backlink chất lượng trỏ về).

Chúng ta đã vừa đi qua các giai đoạn tìm kiếm và sắp xếp dữ liệu của Google, hi vọng bài viết này sẽ giúp các bạn căn bản hiểu được cách tìm kiếm của Google qua đó các bạn có thể dễ dàng giải thích các yếu tố ảnh hưởng đến thứ hạng của website trên Google.

Tốc độ xây dựngliên kết – link velocity thể hiện tốc độ tăng trưởng của backlink trong một thời gian. 

Lọc 1 trang sách rất dễ nhưng với hàng tỷ trang web thì nó lọc và sắp xếp nó sẽ là khối lượng công việc khổng lồ. Google giải quyết bài toán này qua thư viện từ vựng, xây dựng cơ chế chạy song song cho phép xử lý hàng trăm nghìn luồng 1 lúc. Giúp họ sắp xếp toàn bộ các trang website trên thế giới
4.95 sao của 2173 phiếu bầu
Cách Google tìm kiếm sắp xếp thứ hạng website
Cách Google tìm kiếm sắp xếp thứ hạng website
Thủ thuật seo Tư vấn miễn phí 093.784.1299 243 Huỳnh Văn Bánh, Phường 12, Q. Phú Nhuận, HCM
Thiết kế web bán hàng
Thiết kế web bán hàng
Giải pháp thiết kế website bán hàng online mang đến hiệu quả vượt bậc không ngờ cho doanh nghiệp của bạn! Một website được thiết kế tốt quan trọng như thế nào? Bạn không bao giờ có được cơ hội thứ hai để tạo ấn tượng đầu tiên với khách hàng của bạn
Thiết kế web doanh nghiệp
Thiết kế web doanh nghiệp
Chúng tôi dùng sức mạnh Internet làm thay đổi doanh nghiệp bạn bằng một trang web giới thiệu doanh nghiệp, công ty chuyên nghiệp, thiết kế đẹp nhưng vẫn đáp ứng được các tiêu chuẩn seo khắt khe w3c, HTML5, PageSpeed Insights, AMP. Hướng dẫn đào tạo marketing seo miễn phí cho doanh nghiệp
Thiết kế web du lịch
Thiết kế web du lịch
Làm sao để có một trang web du lịch lên top 1 google? Làm sao bạn có thể tìm kiếm khách hàng du lịch từ internet. Một thiết kế web du lịch cơ bản sẽ không đảm bảo cho bạn điều này. Phải thiết kế website du lịch chuẩn seo chuẩn w3c, HTML5, PageSpeed Insights, AMP, thân thiện với mobile
Thiết kế web nhà đất
Thiết kế web nhà đất
Một thiết kế website bđs cần những gì để seo lên top 1 google? Làm sao để thiết kế web bất động sản, web bán dự án, web đăng tin bán nhà bán đất mang lại hiệu quả. Thiết kế web chuẩn seo giới thiệu đến khách hàng một thiết kế web chuyên nghiệp theo chuẩn w3c, HTML5, PageSpeed Insights, AMP
Thiết kế web bán thời trang
Thiết kế web bán thời trang
Thiết kế website bán hàng thời trang, quần áo online chuyên nghiệp chuẩn seo thiết kế thân thiện với các thiết bị di dộng theo tiêu chuẩn html5, W3C PageSpeed Insights...Thiết kế phiên bản web AMP chuyên biệt của google tạo lợi thế khi quảng cáo và seo web lên top 1 google
Thiết kế web nha khoa bệnh viện
Thiết kế web nha khoa bệnh viện
Bạn đang có một phòng khám nha khoa, phòng khám đa khoa, bệnh viện...Làm sao bệnh nhân của bạn biết đến bạn? Thiết kế một trang web nha khoa, phòng khám cơ bản sẽ là chưa đủ. Trang web phải chuẩn seo tối ưu hóa theo chuẩn w3c, thân thiện với mobile , HTML5, PageSpeed Insights, phiên bản AMP
Thiết kế website studio
Thiết kế website studio
Bạn có một studio chụp ảnh cưới đẹp, dịch vụ và tay nghề của bạn chuyên nghiệp. Làm sao bạn có nhiều khách hàng hơn? Giải pháp thiết kế website studio cửa hàng chụp ảnh cưới chuyên nghiệp của thiết kế web chuẩn seo sẽ hỗ trợ bạn tìm kiếm khách hàng một cách hiệu qua nhất bằng dịch vụ trọn gói
Thiết kế website trường học
Thiết kế website trường học
Làm sao để học sinh biết đến học trường mầm non cơ sở giáo dục đào tạo trung tâm ngoại ngữ trung tâm tin học. Giải pháp thiết kế website trường đại học trường mầm non cơ sở giáo dục đào tạo của thiết kế web chuẩn seo với các tiêu chuẩn mới w3c, HTML5,AMP, thân thiện với mobile, PageSpeed Insights
Thiết kế website nhà hàng
Thiết kế website nhà hàng
Khách hàng biết đến nhà hàng, khách sạn, resort, quán ăn...của bạn bằng cách nào? Làm sao để bạn có nhiều khách hàng và thường xuyên hơn. Giải pháp thiết kế website nhà hàng khách sạn resort quán ăn chuyên nghiệp với các tiêu chuẩn mới nhất w3c, AMP, HTML5, PageSpeed Insights cực kì hiệu quả
Thiết kế website khách sạn
Thiết kế website khách sạn
Một website khách sạn cần có những gì? Giới thiệu thông tin hình ảnh phòng của khách sạn không là chưa đủ. Thiết kế website khách sạn chuyên nghiệp cần phải có tính năng cho khách đặt phòng trực tiếp trên web, tích hợp phần mềm quản lý phòng khách sạn chuyên nghiệp tự động cập nhật tình trạng phòng
Thiết kế web cá nhân
Thiết kế web cá nhân
Bạn đã có những thông tin cần thiết cho một website cá nhân? Website được thiết kế đẹp mang đúng phong cách của chủ nhân, màu sắc thiết kế hợp tuổi, hợp phong thủy với chủ nhân. Phần quản trị web đơn giản dễ sử dụng và đều được tích hợp video hướng dẫn cách dùng
Thiết kế web tin tức
Thiết kế web tin tức
Thiết kế web tin tức thật đơn giản nhưng làm sao để trang web được nhiều người biết đến? Một thiết kế web tin tức chuẩn seo, w3c, HTML5, PageSpeed Insights, AMP chuyên nghiệp vẫn là chưa đủ, web còn cần có các tính năng cần thiết chuyên biệt để hỗ trợ seo biên tập nội dung dễ hơn
Thiết kế web