Con chim lửa có đuôi dài, và Yandex, công cụ tìm kiếm lớn nhất nước Nga, đã sử dụng mật danh này cho các truy vấn đuôi dài. Các truy vấn đuôi dài là nhiều từ được đưa vào trong box tìm kiếm; thường được thấy nhiều trong các tìm kiếm bằng giọng nói gần đây. Yandex cho biết rằng khoảng 100 triệu truy vấn mỗi ngày liên quan tới các “ đuôi dài” xuất hiện trên công cụ tìm kiếm.
Yandex ra mắt thuật toán mới tên Palekh để cải thiện kết quả tìm kiếm cho các truy vấn đuôi dài
Có phải rằng thuật toán Palekh của Yandex nhằm đối đầu với RankBrain của Google?
Yandex đã thông báo trên blog Russian của họ rằng Yandex vừa ra mắt một thuật toán mới của họ tập trung vào việc cải thiện cách thức họ xử lý các truy vấn đuôi dài. Thuật toán mới này có tên là Palekh, đây là tên của một thành phố của Nga nổi tiếng trên toàn thế giới với hình ảnh con chim lửa trong nghệ thuật.
Con chim lửa có đuôi dài, và Yandex, công cụ tìm kiếm lớn nhất nước Nga, đã sử dụng mật danh này cho các truy vấn đuôi dài. Các truy vấn đuôi dài là nhiều từ được đưa vào trong box tìm kiếm; thường được thấy nhiều trong các tìm kiếm bằng giọng nói gần đây. Yandex cho biết rằng khoảng 100 triệu truy vấn mỗi ngày liên quan tới các “ đuôi dài” xuất hiện trên công cụ tìm kiếm.
Thuật toán Palekh cho phép Yandex hiểu được ý nghĩa sau mỗi truy vấn, và không chỉ tìm kiếm các từ tương tự. Điều này gợi nhớ đến Google RankBrain. Khi được hỏi thuật toán này có giống với Google RankBrain không, thì Yandex cho biết rằng “ không biết chính xác về công nghệ liên quan đến Google RankBrain, mặc dù những công nghệ này thực sự khá giống nhau”.
Thuật toán Palekh của Yandex đã bắt đầu sử dụng mạng lưới thần kinh như là 1 trong 1500 yếu tố đánh giá thứ hạng. Người phát ngôn của Yandex cho biết rằng họ đã “ quản lý mạng lưới thần kinh để xem xét kết nối giữa một truy vấn và một tài liệu nếu như chúng không chứa các từ thông thường”. Họ làm điều này bằng cách “ chuyển đổi những từ ngữ từ hàng tỷ của các truy vấn tìm kiếm thành các con số ( với 300 con số mỗi nhóm), và đặt chúng vào chiều không gian 300; giờ đây mỗi tài liệu đều có vector riêng trong không gian”, họ cho biết. “ Nếu như các con số của một truy vấn và các con số của một tài liệu thì gần với nhau trong không gian đó, thì kết quả có liên quan”, họ bổ sung thêm.
Khi được hỏi liệu họ có sử dụng machine learning không, thì Yandex cho biết là họ thực sự có sử dụng machine learning và giải thích rằng họ hướng dẫn “ mạng lưới thần kính của họ dựa trên các truy vấn đó, sẽ dẫn đến một số sự tiến bộ trong việc trả lời các cuộc hội thoại dựa trên truy vấn trong tương lai”. Thêm vào đó, họ “ cũng có nhiều mục tiêu ( dự đoán click lâu hơn, CTR, mô hình “ click hay không click” và v.v) hướng dẫn cho mạng lưới thần kinh- các nghiên cứu của chúng tôi cho thấy rằng việc sử dụng nhiều mục tiêu hơn thì hiệu quả hơn”.