Bộ máy tìm kiếm (Search Engine – viết tắt là SE) là công cụ được xây dựng trên nền tảng web cho phép người sử dụng tìm kiếm thông tin, chúng ta có thể tìm bất kỳ thông tin nào bắng cách gõ vào từ khóa (Keyword) cần tìm kiếm, bộ máy tìm kiếm sẻ trả về một danh sách kết quả các trang web có nội dung liên quan đến từ khóa đến từ khóa mà chúng ta nhập vào (SERPs). Hiện nay các bộ máy tìm kiếm nỗi bật nhất là Google, Yahoo, Bing, Ask,… Sử dụng nhiều nhất ở Việt Nam là bội máy tìm kiếm Google.

Các bộ máy tìm kiếm hoạt động như thế nào?
Các bộ máy tìm kiếm liên tục cập nhật bảng chỉ mục (index) của mình và dùng các spider để thu thập thông tin các trang web, những nội dung được sử dụng trên các trang web này sẻ được lưu vào các bảng chỉ mục và khi một nguời nào đó tìm kiếm nội dung này thông qua bộ máy tìm kiếm chúng sẻ trả về danh sách các trang web chứa nội dung đó.Mục đích của bộ máy tìm kiếm.
Mục đích chung của các bộ máy tìm kiếm là cung cấp những thông tin nội dung liên quan một cách chính xác đến người duyệt web và hoàn toàn vô vụ lợi.Bộ máy tìm kiếm xếp hạng như thế nào?
Một Search Engine Optimizer (SEOer) thông minh nên bắt đầu sự nghiệp của mình bắng cách nhìn những website như cách nhìn của các spider, và nều làm được điều này bạn đã thành công một nữa.
Đầu tiên chúng ta phải ghi nhớ là các bộ máy tìm kiếm (SE) xếp hạng các trang web tức là webpage chứ không phải là website.
Các bộ máy tìm kiếm gặp giới hạn khi duyệt qua hình ảnh, Javascript. Chúng ta biết rằng hình ảnh và Javascript sẻ làm cho các trang web sinh động hơn, một bức ảnh với nội dung nào đó có thể rất rỏ ràng với người duyệt web nhưng với các spider thì không có ý nghĩa gì trừ khi sữ dụng các thuộc tính alt và title.
Ví dụ: Với hình ảnh người duyệt web sẻ hiểu nội dung đang đề cập đến seo nhưng với bộ máy tìm kiếm nó sẻ thấy như sau:
<img src=”vd1.jpg” />
Như vậy không có bất cứ thứ gì trong đoạn code trên có nội dung liên quan đến seo nhưng chúng ta có thể thay đổi lại chút síu thì hoàn toàn khác.
<img alt=”Seo” title=”Seo” src=”vd1.jpg” />
Với các làm này các bộ máy tìm kiếm sẻ hiệu được nội dung của tấm hình là seo.
Thêm một vấn đề khác lên quan đến Javascript và CSS là một trong những quy tắc mà đa số các spider là giới hạn trong việc đọc nội dung trang web, ví dụ spider của Google sẻ không đọc nhiều hơn 100KB trong 1 trang cho dù thuật toán của có có quy định phải tìm kiếm từ khóa ở cuối trang. Nếu bạn sử dụng vượt qua giới hạn này thì nổ lực của bạn đã bị hủy bỏ. Vì vậy hảy xem xét cẩn thận nội dung phần HEAD khi có quá nhiều Javascript và CSS được chèn vào.
Có nhiều ví dụ liên quan đến việc các spider xem xét một trang web chẳng hạn như sự tiệm cận của những từ khóa quan trọng trong phần đầu trang web, Ở đây có 1 vấn đề lưu ý những spider thấy chưa chắc tương tự như những gì ta đã thấy, điều này thể hiện rõ qua việc khi chúng ta xem 1 trang web chúng ta sẻ tập trung vào nội dung của trang hơn menu bên trái, còn các spider thì ngược lại thay vì tập trung vào nội dung chúng sẻ xem xét menu trước rồi mới chuyển sang phần nội dung vì đơn giản là vì HTML của menu thường nằm ở phần đầu của trang web.
Hảy nhớ rằng trong lần ghé thăm đầu tiên 1 trang web nào đó các spider chưa biết trang web đó có nội dung gì, bắng cách đọc mã HTML của trang đó các spider có thể phán đoán ra được nội dung của trang web đó.
Sau đó các spider sẻ nén trang web lại và tạo một bảng chỉ mục liên quan đến đến nó, chúng ta có thể hình dung việc các spider làm là nó lưu lại tất cả các từ tìm thấy trên trang web cùng với một số yếu tố quan trọng khác có liên quan đến các từ như sự tiệm cận, tần xuất,…
Những từ được đánh giá cao là những từ được đáp ứng được các tiêu chuẩn quy định của các spider và những từ này sẻ trở thành từ khóa, thực tế no có nhiều yếu tố để xác định việc này bao gồm cả những yếu tố ngoài trang (offpage) bởi các spider có thể xác định được tất cả các từ xuất phát từ những trang khác có liên kết trỏ về trang web.
Khi người duyệt web truy vấn các bộ máy tìm kiếm chúng sẻ xem xét toàn bộ các trang có nội dung liên quan đến câu truy vấn trong cơ sở dữ liệu và từ đây xếp hạng được bắt đầu, mỗi trang đều có các chỉ số trong trang (onpage) chỉ số độc lập của trang (Page Rank) cùng với các chỉ số ngoài trang (offpage) kết hợp các yếu tố để xác định thứ hạng của 1 trang web cụ thể.
Không có nhận xét nào:
Đăng nhận xét