Thuật toán YouTube hoạt động như thế nào?

Mục lục:

Thuật toán YouTube hoạt động như thế nào?
Thuật toán YouTube hoạt động như thế nào?

Video: Thuật toán YouTube hoạt động như thế nào?

Video: Thuật toán YouTube hoạt động như thế nào?
Video: Chặn Người Khác Xài Ké WiFi Nhà Mình ( Modem Viettel HG8045) - YouTube 2024, Có thể
Anonim
Với hơn một tỷ người dùng và hàng tỷ giờ video, thực tế là thuật toán của YouTube quản lý để phân phối những gì bạn muốn xem khi bạn truy cập trang web là một minh chứng cho kỹ nghệ phần mềm. Vì vậy, làm thế nào nó hoạt động?
Với hơn một tỷ người dùng và hàng tỷ giờ video, thực tế là thuật toán của YouTube quản lý để phân phối những gì bạn muốn xem khi bạn truy cập trang web là một minh chứng cho kỹ nghệ phần mềm. Vì vậy, làm thế nào nó hoạt động?

Câu trả lời ngắn gọn: Không ai biết chi tiết - thậm chí không phải YouTube, ở một mức độ nào đó. Thuật toán của YouTube sử dụng tính năng học máy để đề xuất video, điều đó có nghĩa là không có quy tắc nào được chúng tôi có thể cho bạn biết. Bên cạnh đó, Google sẽ không cho chúng tôi biết, vì điều đó sẽ dẫn đến những người khai thác chúng.

Những gì chúng tôi biết

Khi bạn đào tạo một mô hình học máy, bạn cung cấp cho nó một loạt các đầu vào và sau đó xếp hạng các kết quả đầu ra được đề xuất của chúng về cách chúng đúng.
Khi bạn đào tạo một mô hình học máy, bạn cung cấp cho nó một loạt các đầu vào và sau đó xếp hạng các kết quả đầu ra được đề xuất của chúng về cách chúng đúng.

Dưới đây là một ví dụ rất đơn giản. Giả sử bạn muốn huấn luyện AI để biết sự khác biệt giữa hình ảnh của mèo và chó. Về cơ bản, bạn sẽ cung cấp cho AI một loạt các hình ảnh của chó và mèo, bắt đầu lựa chọn, và sau đó ghi điểm đúng nếu nó trả lời đúng. Càng nhiều càng chính xác thì càng chọn càng tốt. Kết quả là một cỗ máy có thể xác định được chó và mèo. Khóa đào tạo này sử dụng số liệu theo đó kết quả được đánh giá; trong trường hợp của chúng tôi, con mèo-o-mét, hoặc phần trăm của hình ảnh thực sự là con mèo.

Số liệu YouTube sử dụng là xem giờ-Cách người dùng ở lại lâu trên video. Điều này có ý nghĩa bởi vì YouTube không muốn mọi người bỏ qua việc tìm kiếm video để xem, vì điều đó có hiệu quả hơn khi kết thúc và ít thời gian xem hơn.

Tuy nhiên, nó còn sắc thái hơn nhiều so với “thời gian bạn xem một video”. Thuật toán đưa vào tài khoản nhiều yếu tố khác nhau và xếp hạng chúng tương ứng: tỷ lệ giữ chân người xem, số lần hiển thị cho số nhấp chuột, mức độ tương tác của người xem và một số yếu tố đằng sau hậu trường mà chúng tôi chưa từng thấy. Sau đó, YouTube điều chỉnh các yếu tố này cho tiểu sử của bạn để có thể đề xuất các video bạn có nhiều khả năng nhấp vào hơn.

Những gì để lấy đi từ này

Nếu bạn là một người dùng YouTube đầy tham vọng, hai điều chính cần làm là tăng tối đa thời lượng xem trung bình và tối đa hóa tỷ lệ nhấp của bạn. Lấy kim tự tháp lộn ngược sau đây.

YouTube đề xuất video của bạn với một nhóm người, trên màn hình chính và trong tab được đề xuất. Trên tài khoản của tôi, tôi có gần 750 nghìn lần hiển thị. Điều đó có vẻ khá tốt, nhưng chỉ một phần nhỏ trong số những người đó nhấp vào video của bạn. Phần này được gọi là tỷ lệ nhấp của bạn và được tính bằng phần trăm (bạn có thể thấy trong ví dụ của tôi rằng tôi có tỷ lệ nhấp chuột là 4,0%). Số lượt xem hiển thị số lượng người thực sự đã nhấp qua.
YouTube đề xuất video của bạn với một nhóm người, trên màn hình chính và trong tab được đề xuất. Trên tài khoản của tôi, tôi có gần 750 nghìn lần hiển thị. Điều đó có vẻ khá tốt, nhưng chỉ một phần nhỏ trong số những người đó nhấp vào video của bạn. Phần này được gọi là tỷ lệ nhấp của bạn và được tính bằng phần trăm (bạn có thể thấy trong ví dụ của tôi rằng tôi có tỷ lệ nhấp chuột là 4,0%). Số lượt xem hiển thị số lượng người thực sự đã nhấp qua.

Sau khi ai đó nhấp vào video, YouTube sẽ đo lượng thời gian những người đã xem video đó.

Bạn có thể thấy lý do tại sao rất nhiều người sáng tạo trên YouTube sử dụng tiêu đề và hình thu nhỏ của clickbait (để nhận các nhấp chuột đó) và dài, rút ra các video (để tăng thời gian lưu). Đây là hai đặc điểm rất khó chịu của nhiều người sáng tạo trên YouTube nhưng hey, đổ lỗi cho thuật toán.

Một trường hợp nghiên cứu

Chúng ta hãy xem xét hai kênh lớn có các cách tiếp cận khác nhau để giải quyết thuật toán. Đầu tiên là Công nghệ nguyên thủy, một kênh được điều hành bởi một anh chàng đi vào vùng hoang dã và xây dựng những thứ không có công cụ. Tất cả các video của anh ấy đều rất dài nhưng vẫn giữ được mức độ tương tác tốt trong suốt thời lượng đó - hoàn toàn là một thành tích vì không có tường thuật. Thực tế này có nghĩa là anh ấy có thể có thời lượng xem trung bình rất cao, điều này rất tốt trong mắt của thuật toán.
Chúng ta hãy xem xét hai kênh lớn có các cách tiếp cận khác nhau để giải quyết thuật toán. Đầu tiên là Công nghệ nguyên thủy, một kênh được điều hành bởi một anh chàng đi vào vùng hoang dã và xây dựng những thứ không có công cụ. Tất cả các video của anh ấy đều rất dài nhưng vẫn giữ được mức độ tương tác tốt trong suốt thời lượng đó - hoàn toàn là một thành tích vì không có tường thuật. Thực tế này có nghĩa là anh ấy có thể có thời lượng xem trung bình rất cao, điều này rất tốt trong mắt của thuật toán.

Bởi vì anh ấy chỉ tạo một video mỗi tháng, điều đáng ngạc nhiên là anh ấy có hơn 8 triệu người đăng ký. Điều này có thể là do thời gian dài giữa các video tạo ra cảm giác mới mẻ khi video tiếp theo giảm xuống. Video của anh ấy mang tính biểu tượng và bất cứ khi nào chúng hiển thị trong nguồn cấp dữ liệu của tôi, tôi hầu như luôn nhấp vào chúng. Tôi đoán những người khác cảm thấy như vậy, vì vậy anh ấy cũng có thể có tỷ lệ nhấp cao.

Image
Image

Kênh thứ hai có một cách tiếp cận hơi scummier. BCC Trolling, một kênh "Moments hài hước" của Fortnite, lấy clip từ các bộ truyền phát phổ biến và chỉnh sửa chúng thành video hàng ngày. Trong năm qua, họ đã nắm vững thuật toán và tăng lên đến 7,3 triệu người đăng ký. Để tối đa hóa thời gian xem, họ đặt clip tiêu đề của video ở đâu đó ở giữa video, buộc mọi người xem video trong một thời gian trước khi đến clip mà họ đã nhấp vào, về cơ bản khiến họ “được ghép nối” trên video. Bởi vì điều này, thời gian xem của họ cao hơn.

Chúng cũng xuất sắc ở hình thu nhỏ và tiêu đề của clickbait, đặt * MỚI * ở tất cả các mũ trên nhiều video và luôn có hình thu nhỏ đầy màu sắc thường được tạo tùy chỉnh và thường rất gây hiểu lầm. Nhưng, họ không phải là clickbait rõ ràng; các video phân phối trên tiêu đề, nhưng chỉ cần nhấp đủ để mọi người nhấp vào.

Đây là điều chính để lấy đi từ BCC: nếu bạn định nhấp vào hình thu nhỏ của mình, hãy làm điều đó một cách tinh tế. Đặt thẳng đứng trong tiêu đề sẽ thường làm cho mọi người tức giận và có thể có tác dụng ngược lại bạn dự định.

Dù bằng cách nào, bạn sẽ tìm thấy những gì làm việc cho bạn, và sử dụng nó để lợi thế của bạn. Hãy lưu ý thời gian xem và tỷ lệ nhấp trong tương lai, nhưng hãy tuân theo định dạng của bạn và không để thuật toán ra lệnh cho nội dung của bạn.

Đề xuất: